Open Access

Optimal Exploration–Exploitation in a Multi-armed Bandit Problem with Non-stationary Rewards

Omar Besbes
Omar Besbes
Graduate School of Business, Columbia University, New York, New York 10027;
Search for more papers by this author
,
Yonatan Gur
Corresponding Author
Yonatan Gur
http://orcid.org/0000-0003-0764-3570
Graduate School of Business, Stanford University, Stanford, California 94305;
Search for more papers by this author
,
Assaf Zeevi
Assaf Zeevi
Graduate School of Business, Columbia University, New York, New York 10027
Search for more papers by this author

Omar Besbes

Graduate School of Business, Columbia University, New York, New York 10027;

Search for more papers by this author

Yonatan Gur

Corresponding Author

Yonatan Gur

http://orcid.org/0000-0003-0764-3570

Graduate School of Business, Stanford University, Stanford, California 94305;

Search for more papers by this author

Assaf Zeevi

Graduate School of Business, Columbia University, New York, New York 10027

Search for more papers by this author

Published Online:31 Oct 2019https://doi.org/10.1287/stsy.2019.0033

Volume 9, Issue 4

December 2019

Pages 319-416

Article Information

Metrics

Information

Received:April 26, 2018
Accepted:March 11, 2019
Published Online:October 31, 2019

Cite as

Omar Besbes, Yonatan Gur, Assaf Zeevi (2019) Optimal Exploration–Exploitation in a Multi-armed Bandit Problem with Non-stationary Rewards. Stochastic Systems 9(4):319-337.

https://doi.org/10.1287/stsy.2019.0033

Keywords

PDF download

Available Issues

Available Issues

Available Issues

Optimal Exploration–Exploitation in a Multi-armed Bandit Problem with Non-stationary Rewards

Volume 9, Issue 4

Article Information

Metrics

Information

Cite as

Keywords

Sign Up for INFORMS Publications Updates and News