Online Combinatorial Optimization under Bandit Feedback

Online Combinatorial Optimization under Bandit Feedback

Multi-Armed Bandits (MAB) constitute the most fundamental model for sequential decision making problems with an exploration vs. exploitation trade-off. In such problems, the decision maker selects an arm in each round and observes a realization of the corresponding unknown reward distribution. Each...

Full description

Bibliographic Details
Main Author:	Talebi Mazraeh Shahi, Mohammad Sadegh
Format:	Others
Language:	English
Published:	KTH, Reglerteknik 2016
Subjects:	Combinatorial Optimization Online Learning Multi-armed Bandits Sequential Decision Making
Online Access:	http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-181321 http://nbn-resolving.de/urn:isbn:978-91-7595-836-1

Similar Items

Minimizing Regret in Combinatorial Bandits and Reinforcement Learning
by: Talebi Mazraeh Shahi, Mohammad Sadegh
Published: (2017)

StreamingBandit: Experimenting with Bandit Policies
by: Jules Kruijswijk, et al.
Published: (2020-08-01)

Efficient Online Learning with Bandit Feedback
by: Liu, Fang
Published: (2020)

Multi-armed bandits with unconventional feedback
by: Gajane, Pratik
Published: (2017)

Structured Stochastic Bandits
by: Magureanu, Stefan
Published: (2016)

Thompson sampling-based online decision making in network routing
by: Huang, Zhiming
Published: (2020)

Contributions to Multi-Armed Bandits : Risk-Awareness and Sub-Sampling for Linear Contextual Bandits
by: Galichet, Nicolas
Published: (2015)

The Perils of Misspecified Priors and Optional Stopping in Multi-Armed Bandits
by: Markus Loecher
Published: (2021-07-01)

Online Learning Approach for Predictive Real-Time Energy Trading in Cloud-RANs
by: Wan Nur Suryani Firuz Wan Ariffin, et al.
Published: (2021-03-01)

A Study of Thompson Sampling Approach for the Sleeping Multi-Armed Bandit Problem
by: Chatterjee, Aritra
Published: (2018)

Altered statistical learning and decision-making in methamphetamine dependence: Evidence from a two-armed bandit task
by: Katia M Harlé, et al.
Published: (2015-12-01)

Non-Stationary Bandit Strategy for Rate Adaptation With Delayed Feedback
by: Yapeng Zhao, et al.
Published: (2020-01-01)

Bandits Manchots sur Flux de Données Non Stationnaires
by: Allesiardo, Robin
Published: (2016)

Multi-channel opportunistic access : a restless multi-armed bandit perspective
by: Wang, Kehao
Published: (2012)

Non Stationary Multi-Armed Bandit: Empirical Evaluation of a New Concept Drift-Aware Algorithm
by: Emanuele Cavenaghi, et al.
Published: (2021-03-01)

Residential HVAC Aggregation Based on Risk-averse Multi-armed Bandit Learning for Secondary Frequency Regulation
by: Xinyi Chen, et al.
Published: (2020-01-01)

Risk-aware multi-armed bandit problem with application to portfolio selection
by: Xiaoguang Huo, et al.
Published: (2017-01-01)

A multi-armed bandit approach for exploring partially observed networks
by: Kaushalya Madhawa, et al.
Published: (2019-05-01)

Online Task Scheduling With Workers Variabilities in Crowdsourcing
by: Qi Li, et al.
Published: (2021-01-01)

Learning the Truth by Weakly Connected Agents in Social Networks Using Multi-Armed Bandit
by: Olusola Tolulope Odeyomi
Published: (2020-01-01)

Multi-Armed Bandits for Spectrum Allocation in Multi-Agent Channel Bonding WLANs
by: Sergio Barrachina-Munoz, et al.
Published: (2021-01-01)

An Empirical Evaluation of Context Aware Clustering of Bandits using Thompson Sampling
by: Campolongo, Nicolò
Published: (2017)

Fast Two-Stage Computation of an Index Policy for Multi-Armed Bandits with Setup Delays
by: José Niño-Mora
Published: (2021-12-01)

A Study of Anode-Supported Solid Oxide Fuel Cell Modeling and Optimization Using Neural Network and Multi-Armed Bandit Algorithm
by: Changhee Song, et al.
Published: (2020-04-01)

Gateway Selection in Millimeter Wave UAV Wireless Networks Using Multi-Player Multi-Armed Bandit
by: Ehab Mahmoud Mohamed, et al.
Published: (2020-07-01)

Learning the Truth in Social Networks Using Multi-Armed Bandit
by: Olusola T. Odeyomi
Published: (2020-01-01)

Bandit feedback in Classification and Multi-objective Optimization
by: Zhong, Hongliang
Published: (2016)

Multi-Armed Bandit Regularized Expected Improvement for Efficient Global Optimization of Expensive Computer Experiments With Low Noise
by: Rajitha Meka, et al.
Published: (2021-01-01)

Bandit Learning with Concurrent Transmissions for Energy-Efficient Flooding in Sensor Networks
by: Peilin Zhang, et al.
Published: (2018-03-01)

A Recommender System for Suggested Sites using Multi-Armed Bandits : Initialising Bandit Contexts by Neural Collaborative Filtering
by: Stenberg, William
Published: (2021)

A New Mechanism of Dynamic Spectrum Access Based on Restless Bandit Allocation Indices
by: Zhu Jiang, et al.
Published: (2015-10-01)

Study of Multi-Armed Bandits for Energy Conservation in Cognitive Radio Sensor Networks
by: Juan Zhang, et al.
Published: (2015-04-01)

An Analysis of the Value of Information When Exploring Stochastic, Discrete Multi-Armed Bandits
by: Isaac J. Sledge, et al.
Published: (2018-02-01)

Bayesian Contextual Bandits for Hyper Parameter Optimization
by: Guoxin Sui, et al.
Published: (2020-01-01)

Relay Selection for Underwater Acoustic Sensor Networks: A Multi-User Multi-Armed Bandit Formulation
by: Xinbin Li, et al.
Published: (2018-01-01)

The Influence of Variance in Two-Armed Bandit Problems
by: 黃秋霖, et al.

Dynamic Multi-Armed Bandit Algorithm for the Cyclic Bandwidth Sum Problem
by: Eduardo Rodriguez-Tello, et al.
Published: (2019-01-01)

Cooperative Relay Selection for Load Balancing With Mobility in Hierarchical WSNs: A Multi-Armed Bandit Approach
by: Jian Zhang, et al.
Published: (2020-01-01)

EFFECTS OF RESPONSE FREQUENCY CONSTRAINTS ON LEARNING IN A NON-STATIONARY MULTI-ARMED BANDIT TASK
by: Racey, Deborah Elaine
Published: (2009)

Influence Maximization Based Global Structural Properties: A Multi-Armed Bandit Approach
by: Mohammed Alshahrani, et al.
Published: (2019-01-01)