Markov Decision Processes with Imprecise Transition Probabilities

Chelsea C. White, III
Chelsea C. White, III
University of Michigan, Ann Arbor, Michigan
Search for more papers by this author
,
Hany K. Eldeib
Hany K. Eldeib
INTELSAT Corporation, Washington, D.C.
Search for more papers by this author

Chelsea C. White, III

University of Michigan, Ann Arbor, Michigan

Search for more papers by this author

Hany K. Eldeib

INTELSAT Corporation, Washington, D.C.

Search for more papers by this author

Published Online:1 Aug 1994https://doi.org/10.1287/opre.42.4.739

Abstract

We present new numerical algorithms and bounds for the infinite horizon, discrete stage, finite state and action Markov decision process with imprecise transition probabilities. We assume that the transition probability mass vector for each state and action is described by a finite number of linear inequalities. This model of imprecision appears to be well suited for describing statistically determined confidence limits and/or natural language statements of likelihood. The numerical procedures for calculating an optimal max-min strategy are based on successive approximations, reward revision, and modified policy iteration. The bounds that are determined are at least as tight as currently available bounds for the case where the transition probabilities are precise.

Cited by
- Efficient constraint generation for stochastic shortest path problems
  Artificial Intelligence, Vol. 354
- Policy Gradient Algorithms for Robust MDP\(\text{s}\) with Nonrectangular Uncertainty Sets
  9 February 2026 | SIAM Journal on Optimization, Vol. 36, No. 1
- On the sensitivity of restless bandits solutions to uncertainty in the models of the arms
  8 September 2025 | Annals of Operations Research, Vol. 355, No. 3
- Solution for Infinite Horizon Double-Factored Markov Decision Processes with Application
  2 October 2025 | Operations Research Forum, Vol. 6, No. 4
- Sequential decision-making under uncertainty: a robust MDPs review
  18 August 2025 | Annals of Operations Research, Vol. 353, No. 3
- On the Convex Formulations of Robust Markov Decision Processes
  Julien Grand-Clément,
  Marek Petrik
  16 July 2024 | Mathematics of Operations Research, Vol. 50, No. 3
- Planning with Linear Temporal Logic Specifications: Handling Quantifiable and Unquantifiable Uncertainty
- On the detection of Markov decision processes
  Automatica, Vol. 175
- Nonprobabilistic methods in uncertainty quantification
- Is Separately Modeling Subpopulations Beneficial for Sequential Decision-Making?
  Ilbin Lee
  18 May 2023 | Operations Research, Vol. 72, No. 6
- Distributionally Robust Chance-Constrained Markov Decision Processes with Random Payoff
  26 July 2024 | Applied Mathematics & Optimization, Vol. 90, No. 1
- Decision-dependent distributionally robust Markov decision process method in dynamic epidemic control
  29 June 2023 | IISE Transactions, Vol. 56, No. 4
- Data-driven remanufacturing planning with parameter uncertainty
  European Journal of Operational Research, Vol. 309, No. 1
- Joint chance-constrained Markov decision processes
  27 October 2022 | Annals of Operations Research, Vol. 322, No. 2
- Robust control of the multi-armed bandit problem
  21 August 2015 | Annals of Operations Research, Vol. 317, No. 2
- Constrained Markov decision processes with uncertain costs
  Operations Research Letters, Vol. 50, No. 2
- Robust Reinforcement Learning: A Review of Foundations and Recent Advances
  19 March 2022 | Machine Learning and Knowledge Extraction, Vol. 4, No. 1
- Improving Competence via Iterative State Space Refinement
- On Robust and Adaptive Fidelity Selection for Human-in-the-loop Queues
- A survey of decision making and optimization under uncertainty
  25 October 2019 | Annals of Operations Research, Vol. 300, No. 2
- An Introduction to Imprecise Markov Chains
  10 September 2020
- Distributionally Robust Learning
  23 December 2020 | Foundations and Trends in Optimization, Vol. 4, No. 1-2
- Robust analysis of discounted Markov decision processes with uncertain transition probabilities
  28 December 2020 | Applied Mathematics-A Journal of Chinese Universities, Vol. 35, No. 4
- Risk aversion to parameter uncertainty in Markov decision processes with an application to slow-onset disaster relief
  11 November 2019 | IISE Transactions, Vol. 52, No. 8
- Improving Competence for Reliable Autonomy
  23 July 2020 | Electronic Proceedings in Theoretical Computer Science, Vol. 319
- Concurrent MDPs with Finite Markovian Policies
  9 March 2020
- Approximating Euclidean by Imprecise Markov Decision Processes
  29 October 2020
- Distributionally robust optimization for sequential decision-making
  18 August 2019 | Optimization, Vol. 68, No. 12
- A data-driven approximate dynamic programming approach based on association rule learning: Spacecraft autonomy as a case study
  Information Sciences, Vol. 504
- An active-set strategy to solve Markov decision processes with good-deal risk measure
  25 February 2019 | Optimization Letters, Vol. 13, No. 6
- Light robustness in the optimization of Markov decision processes with uncertain parameters
  Computers & Operations Research, Vol. 108
- Computation of weighted sums of rewards for concurrent MDPs
  31 October 2018 | Mathematical Methods of Operations Research, Vol. 89, No. 1
- Structural properties of a class of robust inventory and queueing control problems
  7 August 2017 | Naval Research Logistics (NRL), Vol. 65, No. 8
- Optimization of Sequential Decision Making for Chronic Diseases: From Data to Decisions
  Brian T. Denton
  19 October 2018
- Deception in Optimal Control
- Robust Adaptive Routing Under Uncertainty
  Arthur Flajolet,
  Sébastien Blandin,
  Patrick Jaillet
  13 July 2017 | Operations Research, Vol. 66, No. 1
- Multi-Objective Approaches to Markov Decision Processes with Uncertain Transition Parameters
  5 December 2017
- Robust planning with incomplete domain models
  Artificial Intelligence, Vol. 245
- Analysis of Markov Decision Processes Under Parameter Uncertainty
  13 August 2017
- Living-Donor Liver Transplantation Timing under Ambiguous Health State Transition Probabilities
  SSRN Electronic Journal, Vol. 42
- Robust Satisficing Decision Making for Unmanned Aerial Vehicle Complex Missions under Severe Uncertainty
  11 November 2016 | PLOS ONE, Vol. 11, No. 11
- Robust probabilistic planning with ilao
  15 April 2016 | Applied Intelligence, Vol. 45, No. 3
- Distributionally Robust Counterpart in Markov Decision Processes
  IEEE Transactions on Automatic Control, Vol. 61, No. 9
- Real-time dynamic programming for Markov decision processes with imprecise probabilities
  Artificial Intelligence, Vol. 230
- Stochastic dynamics simulation with generalized interval probability
  9 May 2014 | International Journal of Computer Mathematics, Vol. 92, No. 3
- Partially Observable Markov Decision Processes incorporating epistemic uncertainties
  European Journal of Operational Research, Vol. 241, No. 2
- An Argument for the Bayesian Control of Partially Observable Markov Decision Processes
  IEEE Transactions on Automatic Control, Vol. 59, No. 10
- Data-Driven Cyber-Vulnerability Maintenance Policies
  21 November 2017 | Journal of Quality Technology, Vol. 46, No. 3
- References
  29 August 2014
- BOUNDED-PARAMETER PARTIALLY OBSERVABLE MARKOV DECISION PROCESSES: FRAMEWORK AND ALGORITHM
  17 December 2013 | International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, Vol. 21, No. 06
- Robust Modified Policy Iteration
  David L. Kaufman,
  Andrew J. Schaefer,
  6 June 2012 | INFORMS Journal on Computing, Vol. 25, No. 3
- Accounting for parametric uncertainty in Markov decision processes
  Ecological Modelling, Vol. 254
- Robust Markov Decision Processes
  Wolfram Wiesemann,
  Daniel Kuhn,
  Berç Rustem,
  14 November 2012 | Mathematics of Operations Research, Vol. 38, No. 1
- Markov Decision Processes
- Coefficients of ergodicity for Markov chains with uncertain parameters
  20 December 2011 | Metrika, Vol. 76, No. 1
- Robust Control of the Multi-Armed Bandit Problem
  SSRN Electronic Journal, Vol. 32
- Loss bounds for uncertain transition probabilities in Markov decision processes
- Robust Adaptive Markov Decision Processes: Planning with Model Uncertainty
  IEEE Control Systems, Vol. 32, No. 5
- Distributionally Robust Markov Decision Processes
  Huan Xu,
  Shie Mannor,
  1 May 2012 | Mathematics of Operations Research, Vol. 37, No. 2
- Planning with Markov Decision Processes
  11 March 2022
- An Introduction to Fully and Partially Observable Markov Decision Processes
- Using mathematical programming to solve Factored Markov Decision Processes with Imprecise Probabilities
  International Journal of Approximate Reasoning, Vol. 52, No. 7
- Belief function model for reliable optimal set estimation of transition matrices in discounted infinite-horizon Markov decision processes
- Efficient solutions to factored MDPs with imprecise transition probabilities
  Artificial Intelligence, Vol. 175, No. 9-10
- Sequential decision making with partially ordered preferences
  Artificial Intelligence, Vol. 175, No. 7-8
- Discounted Robust Stochastic Games and an Application to Queueing Control
  Erim Kardeş,
  Fernando Ordóñez,
  Randolph W. Hall,
  1 April 2011 | Operations Research, Vol. 59, No. 2
- Sensitivity Analysis and Dynamic Programming
  15 February 2011
- A Geometric Approach to Find Nondominated Policies to Imprecise Reward MDPs
- Approximate Robust Policy Iteration Using Multilayer Perceptron Neural Networks for Discounted Infinite-Horizon Markov Decision Processes With Uncertain Correlated Transition Matrices
  IEEE Transactions on Neural Networks, Vol. 21, No. 8
- IMPRECISE MARKOV CHAINS AND THEIR LIMIT BEHAVIOR
  4 August 2009 | Probability in the Engineering and Informational Sciences, Vol. 23, No. 4
- Discrete time Markov chains with interval probabilities
  International Journal of Approximate Reasoning, Vol. 50, No. 8
- Learning, risk attitude and hot stoves in restless bandit problems
  Journal of Mathematical Psychology, Vol. 53, No. 3
- Reinforcement Learning: A Tutorial Survey and Recent Advances
  Abhijit Gosavi,
  19 December 2008 | INFORMS Journal on Computing, Vol. 21, No. 2
- Robust adaptive Markov Decision Processes in multi-vehicle applications
- Modeling Automotive Assembly Lines with Generalized Stochastic Petri Nets and Markov Decision Processes with Imprecise Probabilities
  7 October 2008
- Robust Optimality for Discounted Infinite-Horizon Markov Decision Processes With Uncertain Transition Matrices
  IEEE Transactions on Automatic Control, Vol. 53, No. 9
- Robust Markov Decision Processes using Sigma Point sampling
- Reachability analysis of uncertain systems using bounded-parameter Markov decision processes
  Artificial Intelligence, Vol. 172, No. 8-9
- A Robust Approach to Markov Decision Problems with Uncertain Transition Probabilities
  IFAC Proceedings Volumes, Vol. 41, No. 2
- Approximate Robust Policy Iteration for Discounted Infinite-Horizon Markov Decision Processes with Uncertain Stationary Parametric Transition Matrices
- Partially observable Markov decision processes with imprecise parameters
  Artificial Intelligence, Vol. 171, No. 8-9
- Robust Dynamic Programming for Discounted Infinite-Horizon Markov Decision Processes with Uncertain Stationary Transition Matrice
- Solving Controlled Markov Set-Chains With Discounting via Multipolicy Improvement
  IEEE Transactions on Automatic Control, Vol. 52, No. 3
- Perfect information two-person zero-sum markov games with imprecise transition probabilities
  21 July 2006 | Mathematical Methods of Operations Research, Vol. 64, No. 2
- Probabilistic Verification of Uncertain Systems Using Bounded-Parameter Markov Decision Processes
- Unifying Nondeterministic and Probabilistic Planning Through Imprecise Markov Decision Processes
- UAV Search for Dynamic Targets with Uncertain Motion Models
- Robust Control of Markov Decision Processes with Uncertain Transition Matrices
  Arnab Nilim,
  Laurent El Ghaoui,
  1 October 2005 | Operations Research, Vol. 53, No. 5
- Error bounds for finite step approximations for solving infinite horizon controlled Markov set-chains
  IEEE Transactions on Automatic Control, Vol. 50, No. 9
- Graphical models for imprecise probabilities
  International Journal of Approximate Reasoning, Vol. 39, No. 2-3
- Dynamic programming for deterministic discrete-time systems with uncertain gain
  International Journal of Approximate Reasoning, Vol. 39, No. 2-3
- Robust Dynamic Programming
  Garud N. Iyengar,
  1 May 2005 | Mathematics of Operations Research, Vol. 30, No. 2
- On Solving Controlled Markov Set-Chains via Multi-Policy Improvement
- MARKOV DECISION PROCESSES WITH UNCERTAIN TRANSITION RATES: SENSITIVITY AND MAX HYPHEN MIN CONTROL
  22 October 2008 | Asian Journal of Control, Vol. 6, No. 2
- Learning and Optimal Control of Imprecise Markov Decision Processes by Dynamic Programming Using the Imprecise Dirichlet Model
- Robust control policy for semi-markov decision processes with dependent uncertain parameters
- Solving factored MDPs using non-homogeneous partitions
  Artificial Intelligence, Vol. 147, No. 1-2
- Generalizing Markov decision processes to imprecise probabilities
  Journal of Statistical Planning and Inference, Vol. 105, No. 1
- Markov decision processes with uncertain transition rates: sensitivity and robust control
- Bounded-parameter Markov decision processes
  Artificial Intelligence, Vol. 122, No. 1-2
- Bounded parameter Markov decision processes
  29 July 2005

Volume 42, Issue 4

July-August 1994

Pages 574-788

Article Information

Metrics

Information

Published Online:August 01, 1994

Cite as

Chelsea C. White, III, Hany K. Eldeib, (1994) Markov Decision Processes with Imprecise Transition Probabilities. Operations Research 42(4):739-749.

https://doi.org/10.1287/opre.42.4.739

Keywords

dynamic programming/optimal control: Markov decision processes

PDF download

Available Issues

Available Issues

Available Issues

Available Issues

Available Issues

Available Issues

Available Issues

Available Issues

Available Issues

Markov Decision Processes with Imprecise Transition Probabilities

Abstract

Volume 42, Issue 4

Article Information

Metrics

Information

Cite as

Keywords

Sign Up for INFORMS Publications Updates and News