Altman E., Feinberg E., Shwartz A. Applications of Markov decision processes in telecommunications: A survey. Markov Decision Processes: Models, Methods, Directions, and Open Problems (2001) (Kluwer, New York) Google Scholar
Babai L., Fortnow L., Lund C. Non-deterministic exponential time has two-prover interactive protocols. Comput. Complexity (1991) 1:3–40Crossref, Google Scholar
Blondel V. D., Tsitsiklis J. N. A survey of computational complexity results in systems and control. Automatica (2000) 36(9):1249–1274Crossref, Google Scholar
Cassandra A., Littman M. L., Zhang N. L. Incremental pruning: A simple, fast, exact method for partially observable Markov decision processes. Proc. Thirteenth Ann. Conf. on Uncertainty in Articial Intelligence (1997) Providence, RI:54–61Google Scholar
Coradeschi S., Karlsson L., Stone P., Balch T., Kraetzschmar G., Asada M. Overview of RoboCup-99. AI Magazine (2000) 21(3):11–18Google Scholar
Hansen E. Solving POMDPs by searching in policy space. In Proc. Fourteenth Ann. Conf. on Uncertainty in Artificial Intelligence (1998) Madison, WI:211–219Google Scholar
Hsu K., Marcus S. I. Decentralized control of finite state Markov processes. IEEE Trans. Auto. Control (1982) AC-27(2):426–431Crossref, Google Scholar
Jaakkola T., Singh S. P., Jordan M. I. Reinforcement learning algorithm for partially observable Markov decision problems. Proc. Adv. in Neural Inform. Processing Systems (1995) 7:345–352Google Scholar
Kaelbling L. P., Littman M. L., Cassandra A. R. Planning and acting in partially observable stochastic domains. Artificial Intelligence (1998) 101(1–2):99–134Crossref, Google Scholar
Lewis H. Complexity of solvable cases of the decision problem for predicate calculus. Proc. Nineteenth Sympos. on the Foundations of Comput. Sci. (1978) Ann Arbor, MI:35–47Crossref, Google Scholar
Lusena C., Goldsmith J., Li T., Sittinger S., Wells C. My brain is full: When more memory helps. Proc. Fifteenth Conf. on Uncertainty in Artificial Intelligence (1999) Stockholm, Sweden:374–381Google Scholar
Madani O., Hanks S., Condon A. On the undecidability of probabilistic planning and infinite-horizon partially observable Markov decision problems. Proc. Sixteenth National Conf. on Artificial Intelligence (1999) Orlando, FL:541–548Google Scholar
Meuleau N., Kim K.-E., Kaelbling L., Cassandra A. R. Solving POMDPs by searching the space of finite policies. Proc. Fifteenth Conf. on Uncertainty in Artificial Intelligence (1999) Stockholm, Sweden:417–426Google Scholar
Mundhenk M., Goldsmith J., Lusena C., Allender E. Complexity of finite-horizon Markov decision process problems. J. ACM (2000) 47(4):681–720Crossref, Google Scholar
Ooi J. M., Wornell G. W. Decentralized control of a multiple access broadcast channel: Performance bounds. In Proc. 35th Conf. on Decision and Control (1996) Kobe, Japan:293–298Crossref, Google Scholar
Papadimitriou C. H.Computational Complexity (1994) (Addison-Wesley, Reading, MA) Google Scholar
Papadimitriou C. H., Tsitsiklis J. On the complexity of designing distributed protocols. Inform. Control (1982) 53:211–218Crossref, Google Scholar
Papadimitriou C. H., Tsitsiklis J. Intractable problems in control theory. SIAM J. Control Optim. (1986) 24(4):639–654Crossref, Google Scholar
Papadimitriou C. H., Tsitsiklis J. The complexity of Markov decision processes. Math. Oper. Res. (1987) 12(3):441–450Link, Google Scholar
Peshkin L., Kim K.-E., Meuleau N., Kaelbling L. P. Learning to cooperate via policy search. Proc. Sixteenth Internat. Conf. on Uncertainty in Artificial Intelligence (2000) Stanford, CA:348–363Google Scholar
Peterson G. L., Reif J. R. Multiple-person alternation. 20th Ann. Sympos. on Foundations of Comput. Sci. (1979) San Juan, PR:348–363Crossref, Google Scholar
Puterman M. L.Markov Decision Processes (1994) (J. Wiley & Sons, New York) Crossref, Google Scholar
Schneider J., Wong W.-K., Moore A., Riedmiller M. Distributed value functions. Proc. Sixteenth Internat. Conf. on Machine Learning (1999) Bled, Slovenia:371–378Google Scholar
Zhang W. Algorithms for partially observable markov decision processes. (2001) . Ph.D. thesis, Hong Kong University of Science and Technology, Kowloon, Hong KongCrossref, Google Scholar

Cited by
- Rate adaption of XP-HARQ assisted NOMA: a decentralized multi-agent DRL perspective
  4 May 2026 | npj Wireless Technology, Vol. 2, No. 1
- Adaptive meta-path discovery for dual-stream collaborative knowledge tracing
  Expert Systems with Applications, Vol. 329
- Reinforcement Learning–Driven Multisensor Fusion for Real‐Time Navigation in Intelligent and Opportunistic Vehicular Networks
  3 April 2026
- Digital twin-driven multi-agent collaborative online optimization of production regulation for smart reconfigurable manufacturing systems with human-robot collaboration
  Robotics and Computer-Integrated Manufacturing, Vol. 101
- Multi-agent deep reinforcement learning for ordering and inventory allocation in a decentralized two-echelon dual-channel supply chain
  International Journal of Production Economics, Vol. 299
- Actions oriented scheduling based on reinforcement Q-learning: an optimized allocation of time-frequency communications for TSCH in IoT networks
  28 May 2026 | Evolving Systems, Vol. 17, No. 3
- Q-CMAPO: A quantum-classical framework for balancing exploration and exploitation in multi-agent reinforcement learning
  3 February 2026 | Quantum Machine Intelligence, Vol. 8, No. 1
- Factored planning in partially observable and deterministic multi-agent domains
  Artificial Intelligence, Vol. 355
- Dynamic masked attention-based contrastive learning for Multi-Agent Reinforcement Learning
  Engineering Applications of Artificial Intelligence, Vol. 173
- Enhancing robustness in multi-agent reinforcement learning via temporal consistency regularization: A self-distillation framework
  Knowledge-Based Systems, Vol. 342
- Scaling Up Multi-Agent Reinforcement Learning for Large Agent Teams and Long-Horizon Tasks: A Survey
  1 June 2026 | ACM Computing Surveys, Vol. 70
- Hierarchical mixture of vital feature experts for mobile target coverage optimization in directional sensor networks
  Journal of Network and Computer Applications, Vol. 249
- Survive and Thrive: Decentralized Multi-Agent Coordination Under Attrition Risks
  IEEE Transactions on Mobile Computing, Vol. 25, No. 5
- LLM-Augmented Multi-Agent Reinforcement Learning for Cross-Scenario Knowledge Transfer
  6 May 2026 | Entropy, Vol. 28, No. 5
- A decision-theoretic representation of assistive interfaces
  13 April 2026
- TSPPO: transformer-based sequential proximal policy optimization for multi-agent systems
  3 February 2026 | Multimedia Systems, Vol. 32, No. 2
- Long-term cooperative path planning for stratospheric airships based on hierarchical multi-agent reinforcement learning
  Engineering Applications of Artificial Intelligence, Vol. 169
- Learning graph based individual intrinsic reward for multi-agent reinforcement learning
  ICT Express, Vol. 12, No. 2
- Planned synchronization for multi-robot systems with active observations
  24 December 2025 | Autonomous Robots, Vol. 50, No. 1
- From One to Many: Adaptive Multi-Agent Pathfinding in Heterogeneous Environments
  26 March 2026 | Optical Memory and Neural Networks, Vol. 35, No. 1
- Evaluating Synthetic Cyber Deception Strategies Under Uncertainty via Game Theory Approach: Linking Information Leakage and Game Outcomes in Cyber Deception
  10 March 2026 | Sensors, Vol. 26, No. 6
- Decentralized Model-Based Policy Optimization for Cooperative Intersection Management
- Network Distributed Multi-Agent Reinforcement Learning for Consensus Control of Quadcopters
- Learning-Based Multi-Robot Active SLAM: A Conceptual Framework and Survey
  30 January 2026 | Applied Sciences, Vol. 16, No. 3
- Trustworthy Agentic Supply Chains: A Governance Framework for Digital Twin Orchestrated AI Decisioning Under Compliance, Auditability, and Data Sovereignty Constraints
  23 January 2026 | International Journal of Latest Technology in Engineering Management & Applied Science, Vol. 15, No. 1
- Self-Evolving Multi-Agent Reinforcement Learning Systems for Decentralized Decision-Making in Open-Ended Environments
- Planning for Actively Synchronized Multi-robot Systems
  2 November 2025
- Anticipating Oblivious Opponents in Stochastic Games
  30 October 2025
- Solving Dec-POMDPs as POMDPs Using Imitation Learning
  15 December 2025
- The Utility and Implementation of Explicit Commands for Ad-Hoc Coordination
  15 February 2026
- Hierarchical Multi-agent Reinforcement Learning with Epistemic Priors for Scalable Communicationless Coordination of Teamable Agents
  1 July 2025
- Towards resilience optimization: Distributed task replanning of multi-UAV system under complex terrain, individual destruction and constrained communication
  Aerospace Science and Technology, Vol. 168
- High-performance multi-agent path finding in high-obstacle-density and large-size maps
  Neurocomputing, Vol. 662
- Multi-Agent Off-Policy Actor-Critic Reinforcement Learning for Partially Observable Environments
  IEEE Open Journal of Control Systems, Vol. 5
- Policy Optimization in Multi-Agent Settings Under Partially Observable Environments
  IEEE Open Journal of Control Systems, Vol. 5
- A Hierarchical Deep Reinforcement Learning Strategy for Collective Pursuit-Evasion Game With Partial Observations
  IEEE Transactions on Artificial Intelligence, Vol. 7, No. 1
- Shapley Meets DCOP: A Unified Structural Credit Assignment for Multiagent Planning and Multiagent Reinforcement Learning
  IEEE Transactions on Automation Science and Engineering, Vol. 23
- Divide and Conquer: Advancing Large-Scale Multi-Agent Pathfinding With Hierarchical Reinforcement Learning
  IEEE Transactions on Mobile Computing, Vol. 25, No. 1
- Drone-Aided Secure Task Offloading Optimization for Internet of Vehicles: Review, Challenges and Method
  IEEE Transactions on Network Science and Engineering, Vol. 13
- Cooperative UAVs for Remote Data Collection Under Limited Communications: An Asynchronous Multiagent Learning Framework
  IEEE Transactions on Wireless Communications, Vol. 25
- BOSA: Bayesian Online Strategy Adaptation for Unexpected Events in Multi-Agent Teams
  IEEE Systems, Man, and Cybernetics Letters, Vol. 1
- AURELIUS: Agentic Uncertainty-Reasoning & Learning with Hierarchical Bayesian Multi-Agents Unified System for Handling Non-Determinism in HealthTech
- Decentralized Reinforcement Learning for Cooperative Multi-Robot Navigation
- SmartHD: Zero-Shot MARL Framework for Multi-Target Tracking on Heterogeneous Extreme Edge Devices
- Principled Learning-to-Communicate with Quasi-Classical Information Structures
- Safety-Aware Multi-Agent Learning for Dynamic Network Bridging
- A Personalized Q-Learning Model for Optimizing Anesthetic Dosing Based on Patient Risk Profiling
- POSGGym: a library for decision-theoretic planning and learning in partially observable, multi-agent environments
  21 July 2025 | Autonomous Agents and Multi-Agent Systems, Vol. 39, No. 2
- Federated multi-agent reinforcement learning: A comprehensive survey of methods, applications and challenges
  Expert Systems with Applications, Vol. 293
- AGOD: Enhancing Multi-Agent Generalization via Attribution-Guided Observation Dropout
  23 December 2025
- IFS: Information Flow Structure for Multi-agent Ad Hoc System
- Automated Multi-Aircraft Rerouting Under Convective Weather Using Policy-Shared Deep Reinforcement Learning
- Learning a robust multiagent driving policy for traffic congestion reduction
  26 November 2023 | Neural Computing and Applications, Vol. 37, No. 31
- A multi-agent deep reinforcement learning approach for multi-echelon inventory optimization and its application to the beer game
  Transportation Research Part E: Logistics and Transportation Review, Vol. 203
- $n$-LIPO: Framework for Diverse Cooperative Agent Generation Using Policy Compatibility
  IEEE Transactions on Artificial Intelligence, Vol. 6, No. 11
- Partially Observable RL: Benign Structures and Simple Generic Algorithms
  Statistical Science, Vol. 40, No. 4
- Multi-UAV Cooperative Pursuit Planning via Communication-Aware Multi-Agent Reinforcement Learning
  6 November 2025 | Aerospace, Vol. 12, No. 11
- Multi-Agent Planning for Pursuing Multiple Objects via Proximal Policy Optimisation
- Feedback-Assisted Decentralized Q-Learning for Dynamic Spectrum Access
- Decentralized Multi-Agent Deep Reinforcement Learning Based Rate Selection of NOMA Assisted XP-HARQ
- Learning Distributed End-to-End Hunting Locomotion for Multiple Quadruped Robots
- Multi-Robot Coordination in an Adversarial Graph-Traversal Game
- Efficient evolutionary curriculum learning for scalable multi-agent reinforcement learning
  24 September 2025 | Journal of King Saud University Computer and Information Sciences, Vol. 37, No. 8
- AI-Enhanced Cloud-Edge-Terminal Collaborative Network: Survey, Applications, and Future Directions
  IEEE Communications Surveys & Tutorials, Vol. 26, No. 2
- Coordinated Online Reinforcement Learning for Self-Adaptive Systems Using Factored Q-Learning
- Decentralized Collective World Model for Emergent Communication and Coordination
- Learn to Refine: Synergistic Multi-Agent Path Optimization for Lifelong Conflict-Free Navigation of Autonomous Vehicles
  3 August 2025
- Last-Iterate Convergence to Approximate Nash Equilibria in Multiplayer Imperfect Information Games
  IEEE Transactions on Neural Networks and Learning Systems, Vol. 36, No. 8
- AI Agents: From Concept to Code to Commerce
- SD2AC: A reinforcement learning framework using distribution evaluation and sequential decision-making for UCAV combat
  25 April 2025 | Journal of Computational Design and Engineering, Vol. 12, No. 7
- FairSignal: A Multiagent Reinforcement Learning Approach Considering Fairness for Multi-Intersection Traffic Signal Control
  IEEE Internet of Things Journal, Vol. 12, No. 13
- Pragmatic Communication for Remote Control of Finite-State Markov Processes
  IEEE Journal on Selected Areas in Communications, Vol. 43, No. 7
- ADAC: Actor-Double-Attention-Critic for Multi-Agent Cooperation in Mixed Cooperative-Competitive Environments
  IEEE Transactions on Intelligent Transportation Systems, Vol. 26, No. 7
- Cooperative Persistent Surveillance with a Multi-Ugv System based on Reinforcement Learning
- Enhancing Neural Fictitious Self-Play for Symmetric Team Games: A Two-Stage Training Framework
- Optimizing Algorithmic Decisions in Executive Game Simulations
- Multi-Agent Reinforcement Learning Scheduling to Support Low Latency in Teleoperated Driving
- Designing a skilled soccer team for RoboCup: exploring skill-set-primitives through reinforcement learning
  11 April 2025 | Neural Computing and Applications, Vol. 37, No. 18
- Double mixing networks based monotonic value function decomposition algorithm for swarm intelligence in UAVs
  5 March 2025 | Autonomous Agents and Multi-Agent Systems, Vol. 39, No. 1
- ISR-MAPF: Integrated Search and Reinforcement Learning method for Multi-Agent Path Planning
- Enhancing multi-agent communication through credibility and reward-based optimisation
  14 May 2025 | International Journal of General Systems, Vol. 33
- A Stackelberg-based deep reinforcement learning approach for dynamic cooperative advertising in a two-echelon supply chain
  Computers & Chemical Engineering, Vol. 196
- XLight: An interpretable multi-agent reinforcement learning approach for traffic signal control
  Expert Systems with Applications, Vol. 273
- Boosting the Training of Deep Reinforcement Learning Traffic Control by Using the World Model
  IEEE Intelligent Transportation Systems Magazine, Vol. 17, No. 3
- Cooperative multi-agent reinforcement learning for robotic systems: A review
  29 August 2025 | Multiagent and Grid Systems, Vol. 21, No. 2
- Comparing Statistical, Analytical, and Learning-Based Routing Approaches for Delay-Tolerant Networks
  11 April 2025 | ACM Transactions on Modeling and Computer Simulation, Vol. 35, No. 2
- Multi-Agent Reinforcement Learning in Partially Observable Environments Using Social Learning
- Learning general multi-agent decision model through multi-task pre-training
  Neurocomputing, Vol. 627
- QTypeMix: Enhancing multi-agent cooperative strategies through heterogeneous and homogeneous value decomposition
  Neural Networks, Vol. 184
- Neighborhood-Curiosity-Based Exploration in Multiagent Reinforcement Learning
  IEEE Transactions on Cognitive and Developmental Systems, Vol. 17, No. 2
- Reinforced GNNs for Multiple Instance Learning
  IEEE Transactions on Neural Networks and Learning Systems, Vol. 36, No. 4
- Optimization methods in fully cooperative scenarios: a review of multiagent reinforcement learning
  7 May 2025 | Frontiers of Information Technology & Electronic Engineering, Vol. 26, No. 4
- Priority Sequential Inference: Improving Safety for Efficient Autonomous Highway Driving Using MARL
  IEEE Sensors Journal, Vol. 25, No. 6
- A multi-agent collaborative algorithm for task-oriented dialogue systems
  30 September 2024 | International Journal of Machine Learning and Cybernetics, Vol. 16, No. 3
- Multiple ships cooperative navigation and collision avoidance using multi-agent reinforcement learning with communication
  Ocean Engineering, Vol. 320
- Hierarchical Multi-Agent Meta-Reinforcement Learning for Cross-Channel Bidding
  IEEE Transactions on Knowledge and Data Engineering, Vol. 37, No. 3
- Beyond the Edge: An Advanced Exploration of Reinforcement Learning for Mobile Edge Computing, Its Applications, and Future Research Trajectories
  IEEE Communications Surveys & Tutorials, Vol. 27, No. 1
- A Decentralized Shotgun Approach for Team Deception
  11 October 2024
- Multi-Robot Systems
  1 May 2025
- H2L: High-Performance Multi-agent Path Finding in High-Obstacle-Density and Large-Size Maps
  11 March 2025
- A multi-agent curiosity reward model for task-oriented dialogue systems
  Pattern Recognition, Vol. 157
- Efficient multi-agent reinforcement learning for dexterous manipulation: a hierarchical framework with opponent modeling
  Procedia Computer Science, Vol. 271
- Task-Oriented Communication Design at Scale
  IEEE Transactions on Communications, Vol. 73, No. 1
- Evasive Active Hypothesis Testing With Deep Neuroevolution: The Single- and Multi-Agent Cases
  IEEE Transactions on Information Forensics and Security, Vol. 20
- Multi-agent Multi-game Entity Transformer: Towards Generalist Models in MARL
  16 September 2025
- Decentralized Stochastic Control in Borel Spaces: Centralized MDP Reductions, Near Optimality of Finite Window Local Information, and Q-Learning
- Cooperative UAVs with Asynchronous Multi-agent Learning for Remote Data Collection
- Formal contracts mitigate social dilemmas in multi-agent reinforcement learning
  18 October 2024 | Autonomous Agents and Multi-Agent Systems, Vol. 38, No. 2
- Mobile robot sequential decision making using a deep reinforcement learning hyper-heuristic approach
  Expert Systems with Applications, Vol. 257
- Goal-Oriented Tensor: Beyond Age of Information Toward Semantics-Empowered Goal-Oriented Communications
  IEEE Transactions on Communications, Vol. 72, No. 12
- Differentiated Federated Reinforcement Learning Based Traffic Offloading on Space-Air-Ground Integrated Networks
  IEEE Transactions on Mobile Computing, Vol. 23, No. 12
- Decentralized Coordination for Multi-Agent Data Collection in Dynamic Environments
  IEEE Transactions on Mobile Computing, Vol. 23, No. 12
- Adversarial Attacks on Multiagent Deep Reinforcement Learning Models in Continuous Action Space
  IEEE Transactions on Systems, Man, and Cybernetics: Systems, Vol. 54, No. 12
- DTPPO: Dual-Transformer Encoder-Based Proximal Policy Optimization for Multi-UAV Navigation in Unseen Complex Environments
  29 November 2024 | Drones, Vol. 8, No. 12
- Multi-Agent Probabilistic Ensembles With Trajectory Sampling for Connected Autonomous Vehicles
  IEEE Transactions on Vehicular Technology, Vol. 73, No. 11
- Multi-Agent Reinforcement Learning for Distributed Workflow Orchestration at the Tactical Edge
- Decentralized Multi-UAV Management in Mobile Edge Computing: A Hierarchical Reinforcement Learning Approach
- Multi-Robot Communication-Aware Cooperative Belief Space Planning with Inconsistent Beliefs: An Action-Consistent Approach
- Bi-CL: A Reinforcement Learning Framework for Robots Coordination Through Bi-level Optimization
- ICOPP: A Highway Autonomous Driving Planner Based on Interactive Collaborative Optimization and POMDP
  Journal of Physics: Conference Series, Vol. 2868, No. 1
- Joint Trajectory Planning and Communication Design for Multiple UAVs in Intelligent Collaborative Air–Ground Communication Systems
  IEEE Internet of Things Journal, Vol. 11, No. 19
- Optimal Communication and Control Strategies in a Cooperative Multiagent MDP Problem
  IEEE Transactions on Automatic Control, Vol. 69, No. 10
- Multi-Agent Fingerprints-Enhanced Distributed Intelligent Handover Algorithm in LEO Satellite Networks
  IEEE Transactions on Vehicular Technology, Vol. 73, No. 10
- SigmaRL: A Sample-Efficient and Generalizable Multi-Agent Reinforcement Learning Framework for Motion Planning
- HSVI Can Solve Zero-Sum Partially Observable Stochastic Games
  2 September 2023 | Dynamic Games and Applications, Vol. 14, No. 4
- Coordinate-aligned multi-camera collaboration for active multi-object tracking
  29 July 2024 | Multimedia Systems, Vol. 30, No. 4
- Neural Estimation of Multi-User Capacity Regions Over Discrete Channels
- Game‐theoretic algorithm for interdependent infrastructure network restoration in a decentralized environment
  4 January 2024 | Risk Analysis, Vol. 44, No. 7
- Adaptive Privacy Budget Allocation in Federated Learning: A Multi-Agent Reinforcement Learning Approach
- Collaborative Optimization of the Age of Information Under Partial Observability
- An Overestimation Reduction Method Based on the Multi-step Weighted Double Estimation Using Value-Decomposition Multi-agent Reinforcement Learning
  23 April 2024 | Neural Processing Letters, Vol. 56, No. 3
- A Pilot Study of Observation Poisoning on Selective Reincarnation in Multi-Agent Reinforcement Learning
  2 May 2024 | Neural Processing Letters, Vol. 56, No. 3
- Entropy Enhanced Multiagent Coordination Based on Hierarchical Graph Learning for Continuous Action Space
  IEEE Transactions on Cognitive and Developmental Systems, Vol. 16, No. 3
- Leveraging Joint-Action Embedding in Multiagent Reinforcement Learning for Cooperative Games
  IEEE Transactions on Games, Vol. 16, No. 2
- Transformer in reinforcement learning for decision-making: a survey
  5 July 2024 | Frontiers of Information Technology & Electronic Engineering, Vol. 25, No. 6
- Multi-Robot Cooperative Socially-Aware Navigation Using Multi-Agent Reinforcement Learning
- Multi-query TDSP for Path Planning in Time-varying Flow Fields
- Achieving Fair-Effective Communications and Robustness in Underwater Acoustic Sensor Networks: A Semi-Cooperative Approach
  IEEE Transactions on Mobile Computing, Vol. 23, No. 5
- Goal-Oriented Tensor: Beyond AoI Towards Semantics-Empowered Goal-Oriented Communications
- On the computational complexity of ethics: moral tractability for minds and machines
  31 March 2024 | Artificial Intelligence Review, Vol. 57, No. 4
- Multi-agent cooperation policy gradient method based on enhanced exploration for cooperative tasks
  30 September 2023 | International Journal of Machine Learning and Cybernetics, Vol. 15, No. 4
- eMARLIN: Distributed Coordinated Adaptive Traffic Signal Control with Topology-Embedding Propagation
  11 July 2023 | Transportation Research Record: Journal of the Transportation Research Board, Vol. 2678, No. 4
- Partially observed optimal control of local and remote controllers
  21 December 2023 | International Journal of Robust and Nonlinear Control, Vol. 34, No. 5
- An improved sand cat swarm optimization for moving target search by UAV
  Expert Systems with Applications, Vol. 238
- Decentralized policy learning with partial observation and mechanical constraints for multiperson modeling
  Neural Networks, Vol. 171
- A collective AI via lifelong learning and sharing at the edge
  22 March 2024 | Nature Machine Intelligence, Vol. 6, No. 3
- Contingency Games for Multi-Agent Interaction
  IEEE Robotics and Automation Letters, Vol. 9, No. 3
- Regularized Knowledge Transfer for Multi-Agent Reinforcement Learning
  1 March 2024 | Signal and Data Processing, Vol. 20, No. 4
- Revealing perceived individuals’ self-interest
  5 April 2023 | Journal of the Operational Research Society, Vol. 75, No. 2
- Reward-Guided Individualised Communication for Deep Reinforcement Learning in Multi-Agent Systems
  1 February 2024
- VMAS: A Vectorized Multi-agent Simulator for Collective Robot Learning
  1 February 2024
- A Meta-MDP Approach for Information Gathering Heterogeneous Multi-agent Systems
  8 May 2024
- Towards Distributed Control Under Deficient Communication with Multi-agent Reinforcement Learning
  19 July 2024
- Distributed Station Assignment Through Learning
  25 August 2024
- Heterogeneous Teams
  30 August 2024
- Research on Multi-Agent Cooperative Tasks Based on Improved Proximal Policy Optimization
  31 January 2025
- Targeted multi-agent communication algorithm based on state control
  Defence Technology, Vol. 31
- Distributed Multi-Sensor Control for Multi-Target Tracking With a Sparsity-Promoting Objective Function
  IEEE Signal Processing Letters, Vol. 31
- AoI-Aware Energy-Efficient SFC in UAV-Aided Smart Agriculture Using Asynchronous Federated Learning
  IEEE Open Journal of the Communications Society, Vol. 5
- KGAgent: Learning a Deep Reinforced Agent for Keyphrase Generation
  IEEE/ACM Transactions on Audio, Speech, and Language Processing, Vol. 32
- Multi-Agent Deep Reinforcement Learning for UAVs Navigation in Unknown Complex Environment
  IEEE Transactions on Intelligent Vehicles, Vol. 9, No. 1
- Distributed Policy Gradient for Linear Quadratic Networked Control With Limited Communication Range
  IEEE Transactions on Signal Processing, Vol. 72
- Multi-Objective Multi-Agent Planning for Discovering and Tracking Multiple Mobile Objects
  IEEE Transactions on Signal Processing, Vol. 72
- Collaborative Attack Sequence Generation Model Based on Multiagent Reinforcement Learning for Intelligent Traffic Signal System
  18 October 2024 | International Journal of Intelligent Systems, Vol. 2024, No. 1
- From Reactive to Active Sensing: A Survey on Information Gathering in Decision-theoretic Planning
  13 July 2023 | ACM Computing Surveys, Vol. 55, No. 13s
- Effi-MAOT: A Communication-Efficient Multi-Camera Active Object Tracking
- Non-Stationary Policy Learning for Multi-Timescale Multi-Agent Reinforcement Learning
- GQN: Multi-Agent Deep Reinforcement Learning based on Graph Networks
- Multi-Agent Probabilistic Ensembles with Trajectory Sampling for Connected Autonomous Vehicles
- Scalable Quantification of the Value of Information for Multi-Agent Communications and Control Co-design
- MARBLER: An Open Platform for Standardized Evaluation of Multi-Robot Reinforcement Learning Algorithms
- Decision making in open agent systems
  9 October 2023 | AI Magazine, Vol. 44, No. 4
- Learning scalable and efficient communication policies for multi-robot collision avoidance
  19 August 2023 | Autonomous Robots, Vol. 47, No. 8
- Simultaneous search and monitoring by multiple aerial robots
  Robotics and Autonomous Systems, Vol. 170
- Multi-Agent Deep Reinforcement Learning for Cooperative Computing Offloading and Route Optimization in Multi Cloud-Edge Networks
  IEEE Transactions on Network and Service Management, Vol. 20, No. 4
- Collaborative Cost Multi-Agent Decision-Making Algorithm with Factored-Value Monte Carlo Tree Search and Max-Plus
  17 December 2023 | Games, Vol. 14, No. 6
- Multi-Agent Planning and Diagnosis with Commonsense Reasoning
  30 December 2023
- An Algorithm Combining Hidden States for Monotonic Value Function Factorisation
  1 June 2024
- TEAMSTER: Model-based reinforcement learning for ad hoc teamwork
  Artificial Intelligence, Vol. 324
- Achieving Maximum Urgency-Dependent Throughput in Random Access
  IEEE Transactions on Communications, Vol. 71, No. 11
- Communication-enabled deep reinforcement learning to optimise energy-efficiency in UAV-assisted networks
  Vehicular Communications, Vol. 43
- Formal Modelling for Multi-Robot Systems Under Uncertainty
  15 August 2023 | Current Robotics Reports, Vol. 4, No. 3
- A hybrid cognitive model for machine agents
  Cognitive Systems Research, Vol. 81
- A Cooperative Multiagent Reinforcement Learning Framework for Droplet Routing in Digital Microfluidic Biochips
  IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems, Vol. 42, No. 9
- Quantifying Faulty Assumptions in Heterogeneous Multi-Agent Systems *
- Multi-Agent Deep Reinforcement Learning Based Resource Allocation for Ultra-Reliable Low-Latency Internet of Controllable Things
  IEEE Transactions on Wireless Communications, Vol. 22, No. 8
- A Multi-Agent Actor-Critic Based Approach Applied to the Snake Game
- Work-in-Progress: A Hybrid Collaborative Multi Agent Decision Making Algorithm With Factored-Value Max-Plus
- Multi-Agent Reinforcement Learning with Epistemic Priors
- Efficient Multi-Agent Exploration with Mutual-Guided Actor-Critic
- Dynamic Optimization of Random Access in Deadline-Constrained Broadcasting
  IEEE Transactions on Network Science and Engineering, Vol. 10, No. 4
- Attentional Opponent Modelling for Multi-agent Cooperation
- Curriculum Learning Based Multi-Agent Path Finding for Complex Environments
- Deep multiagent reinforcement learning: challenges and directions
  19 October 2022 | Artificial Intelligence Review, Vol. 56, No. 6
- A review of cooperative multi-agent deep reinforcement learning
  14 October 2022 | Applied Intelligence, Vol. 53, No. 11
- Cascading Negative Transfer in Networks of Machine Learning Systems
- Multi-agent deep reinforcement learning algorithm with self-adaption division strategy for VNF-SC deployment in SDN/NFV-Enabled Networks
  Applied Soft Computing, Vol. 138
- Generalization of Safe Optimal Control Actions on Networked Multiagent Systems
  IEEE Transactions on Control of Network Systems, Vol. 10, No. 1
- Mastering Arterial Traffic Signal Control With Multi-Agent Attention-Based Soft Actor-Critic Model
  IEEE Transactions on Intelligent Transportation Systems, Vol. 24, No. 3
- Evaluating Emergent Coordination in Multi-Agent Task Allocation Through Causal Inference and Sub-Team Identification
  IEEE Robotics and Automation Letters, Vol. 8, No. 2
- Partially Observable Markov Decision Processes in Robotics: A Survey
  IEEE Transactions on Robotics, Vol. 39, No. 1
- Decoupled Monte Carlo Tree Search for Cooperative Multi-Agent Planning
  2 February 2023 | Applied Sciences, Vol. 13, No. 3
- Safe Optimal Control with Synthesized Waypoints as Guidance
  19 January 2023
- Constrained Multiagent Reinforcement Learning for Large Agent Population
  17 March 2023
- Team-Imitate-Synchronize for Solving Dec-POMDPs
  17 March 2023
- Evaluation of Creating Scoring Opportunities for Teammates in Soccer via Trajectory Prediction
  25 February 2023
- Answerable and Unanswerable Questions in Decision and Risk Analysis
  6 July 2023
- The Design of Transparency Communication for Human-Multirobot Teams
  9 July 2023
- Decision-Based DCNs
  17 January 2023
- A decentralised multi-agent system for rail freight traffic management
  6 July 2021 | Annals of Operations Research, Vol. 320, No. 2
- Decentralized Learning of Finite-Memory Policies in Dec-POMDPs
  IFAC-PapersOnLine, Vol. 56, No. 2
- Online computation offloading with double reinforcement learning algorithm in mobile edge computing
  Journal of Parallel and Distributed Computing, Vol. 171
- Complexity of planning for connected agents in a partially known environment
  Theoretical Computer Science, Vol. 941
- Answer Set Planning: A Survey
  1 April 2022 | Theory and Practice of Logic Programming, Vol. 23, No. 1
- Constrained Federated Learning for AoI-Limited SFC in UAV-Aided MEC for Smart Agriculture
  IEEE Transactions on Machine Learning in Communications and Networking, Vol. 1
- Multi-UAV Autonomous Path Planning in Reconnaissance Missions Considering Incomplete Information: A Reinforcement Learning Method
  23 December 2022 | Drones, Vol. 7, No. 1
- Diversifying agent's behaviors in interactive decision models
  15 September 2022 | International Journal of Intelligent Systems, Vol. 37, No. 12
- Optimizing Food Allocation in Food Banks with Multi-agent Deep Reinforcement Learning
- Distributed Reinforcement Learning for Decentralized Linear Quadratic Control: A Derivative-Free Policy Optimization Approach
  IEEE Transactions on Automatic Control, Vol. 67, No. 12
- Peer-to-Peer Trading for Energy-Saving Based on Reinforcement Learning
  19 December 2022 | Energies, Vol. 15, No. 24
- Common belief multi-agent reinforcement learning based on variational recurrent models
  Neurocomputing, Vol. 513
- Multiagent Meta-Reinforcement Learning for Adaptive Multipath Routing Optimization
  IEEE Transactions on Neural Networks and Learning Systems, Vol. 33, No. 10
- Pruning the Communication Bandwidth between Reinforcement Learning Agents through Causal Inference: An Innovative Approach to Designing a Smart Grid Power System
  13 October 2022 | Sensors, Vol. 22, No. 20
- Polynomial-Time Algorithms for Multiagent Minimal-Capacity Planning
  IEEE Transactions on Control of Network Systems, Vol. 9, No. 3
- Cooperative Multi-Agent Deep Reinforcement Learning for Dynamic Virtual Network Allocation With Traffic Fluctuations
  IEEE Transactions on Network and Service Management, Vol. 19, No. 3
- Adaptive algorithm for dependent infrastructure network restoration in an imperfect information sharing environment
  24 August 2022 | PLOS ONE, Vol. 17, No. 8
- Multi-agent-based dynamic railway scheduling and optimization: a coloured petri-net model
  16 June 2022 | Advances in Computational Intelligence, Vol. 2, No. 4
- Knowledge-based strategies for multi-agent teams playing against Nature
  Artificial Intelligence, Vol. 309
- Credit-of-Q-value for Multi-Agent Reinforcement Learning
- Deep reinforcement learning for dynamic scheduling of a flexible job shop
  11 April 2022 | International Journal of Production Research, Vol. 60, No. 13
- Enhancing cooperation by cognition differences and consistent representation in multi-agent reinforcement learning
  8 January 2022 | Applied Intelligence, Vol. 52, No. 9
- Provably Efficient Multi-Agent Reinforcement Learning with Fully Decentralized Communication
- Decentralized Control of Two Agents with Nested Accessible Information
- Communication-Efficient Policy Gradient Methods for Distributed Reinforcement Learning
  IEEE Transactions on Control of Network Systems, Vol. 9, No. 2
- Multi-Agent Data Collection in Non-Stationary Environments
- UDARMF: An Underwater Distributed and Adaptive Resource Management Framework
  IEEE Internet of Things Journal, Vol. 9, No. 10
- Misinformation and Disinformation in Modern Warfare
  Yanling Chang,
  Matthew F. Keblis,
  Ran Li,
  Eleftherios Iakovou,
  Chelsea C. White
  18 February 2022 | Operations Research, Vol. 70, No. 3
- Dynamic distributed constraint optimization using multi-agent reinforcement learning
  16 March 2022 | Soft Computing, Vol. 26, No. 8
- Scalable and Transferable Reinforcement Learning for Multi-Agent Mixed Cooperative–Competitive Environments Based on Hierarchical Graph Attention
  18 April 2022 | Entropy, Vol. 24, No. 4
- A Hybrid PAC Reinforcement Learning Algorithm for Human-Robot Interaction
  9 March 2022 | Frontiers in Robotics and AI, Vol. 9
- A Partially Observable Stochastic Zero-sum Game for a Network Epidemic Control Problem
  15 February 2022 | Dynamic Games and Applications, Vol. 12, No. 1
- Tensor decomposition for multi-agent predictive state representation
  Expert Systems with Applications, Vol. 189
- Fast-DRD: Fast decentralized reinforcement distillation for deadline-aware edge computing
  Information Processing & Management, Vol. 59, No. 2
- A Unified Approach to Dynamic Decision Problems With Asymmetric Information: Nonstrategic Agents
  IEEE Transactions on Automatic Control, Vol. 67, No. 3
- Multi-agent deep reinforcement learning: a survey
  15 April 2021 | Artificial Intelligence Review, Vol. 55, No. 2
- Survey of Deep Reinforcement Learning for Motion Planning of Autonomous Vehicles
  IEEE Transactions on Intelligent Transportation Systems, Vol. 23, No. 2
- Provably Efficient Reinforcement Learning in Decentralized General-Sum Markov Games
  5 January 2022 | Dynamic Games and Applications, Vol. 62
- A Deep Q-Network for the Beer Game: Deep Reinforcement Learning for Inventory Optimization
  Afshin Oroojlooyjadid,
  MohammadReza Nazari,
  Lawrence V. Snyder,
  Martin Takáč
  23 February 2021 | Manufacturing & Service Operations Management, Vol. 24, No. 1
- Multi-agent Learning of Numerical Methods for Hyperbolic PDEs with Factored Dec-MDP
  13 October 2022
- Multi-Agent Reinforcement Learning
  12 March 2022
- Belief State Monte Carlo Planning for Multi-agent Visibility-Based Pursuit-Evasion
  24 December 2022
- Attentive Relational State Representation for Intelligent Joint Operation Simulation
  20 January 2023
- An action language for multi-agent domains
  Artificial Intelligence, Vol. 302
- Cooperative Multiagent Attentional Communication for Large‐Scale Task Space
  24 January 2022 | Wireless Communications and Mobile Computing, Vol. 2022, No. 1
- Hierarchical Deep Reinforcement Learning for Multi-robot Cooperation in Partially Observable Environment
- Collaborative Allocation and Optimization of Path Planning for Static and Mobile Sensors in Hybrid Sensor Networks for Environment Monitoring and Anomaly Search
  26 November 2021 | Sensors, Vol. 21, No. 23
- Solving infinite-horizon Dec-POMDPs using Finite State Controllers within JESP
- Applications of Multi-Agent Deep Reinforcement Learning: Models and Algorithms
  17 November 2021 | Applied Sciences, Vol. 11, No. 22
- End-to-End control of USV swarm using graph centric Multi-Agent Reinforcement Learning
- Utilizing Multi-Agent Deep Reinforcement Learning For Flexible Job Shop Scheduling Under Sustainable Viewpoints
- Structural relational inference actor-critic for multi-agent reinforcement learning
  Neurocomputing, Vol. 459
- Survey on Unmanned Aerial Vehicle Networks: A Cyber Physical System Perspective
  IEEE Communications Surveys & Tutorials, Vol. 22, No. 2
- Impact of Heterogeneity and Risk Aversion on Task Allocation in Multi-Agent Teams
  IEEE Robotics and Automation Letters, Vol. 6, No. 4
- Arsenal: Understanding Learning-Based Wireless Video Transport via In-Depth Evaluation
  IEEE Transactions on Vehicular Technology, Vol. 70, No. 10
- Multi-Agent Distributed Deep Deterministic Policy Gradient for Partially Observable Tracking
  14 October 2021 | Actuators, Vol. 10, No. 10
- Motion-Encoded Electric Charged Particles Optimization for Moving Target Search Using Unmanned Aerial Vehicles
  30 September 2021 | Sensors, Vol. 21, No. 19
- Agent-Aware State Estimation in Autonomous Vehicles
- A Scalable Real-Time Multiagent Decision Making Algorithm with Cost
- A Comprehensive Study of Cognitive Graphs: Techniques, Applications, and Challenges
- Cooperative Task Allocation of Multiple VA Vs Based on Greedy Algorithm
- A survey of inverse reinforcement learning: Challenges, methods and progress
  Artificial Intelligence, Vol. 297
- The complexity of reachability in parametric Markov decision processes
  Journal of Computer and System Sciences, Vol. 119
- Deep reinforcement learning driven inspection and maintenance planning under incomplete information and constraints
  Reliability Engineering & System Safety, Vol. 212
- A Deep Reinforcement Learning Framework for Contention-Based Spectrum Sharing
  IEEE Journal on Selected Areas in Communications, Vol. 39, No. 8
- Cooperative Multi-Agent Deep Reinforcement Learning for Dynamic Virtual Network Allocation
- Multi-Robot Guided Policy Search for Learning Decentralized Swarm Control
  IEEE Control Systems Letters, Vol. 5, No. 3
- Graph neural network and reinforcement learning for multi‐agent cooperative control of connected autonomous vehicles
  Computer-Aided Civil and Infrastructure Engineering, Vol. 36, No. 7
- Intention estimation and controllable behaviour models for traffic merges
  18 March 2021 | SICE Journal of Control, Measurement, and System Integration, Vol. 14, No. 2
- A Multi-UAV System for Exploration and Target Finding in Cluttered and GPS-Denied Environments
- System of Systems Engineering Approach for Complex Deterministic and Nondeterministic Systems (ACDANS)
- A Multiagent Reinforcement Learning Solution for Geometric Configuration Optimization in Passive Location Systems
  Mathematical Problems in Engineering, Vol. 2021
- A projective simulation scheme for partially observable multi-agent systems
  29 March 2021 | Quantum Machine Intelligence, Vol. 3, No. 1
- Multi-Agent Reinforcement Learning: A Review of Challenges and Applications
  27 May 2021 | Applied Sciences, Vol. 11, No. 11
- Deep Reinforcement Learning for Attacking Wireless Sensor Networks
  12 June 2021 | Sensors, Vol. 21, No. 12
- Robust Planning with Emergent Human-like Behavior for Agents Traveling in Groups
- Hierarchical MCTS for Scalable Multi-Vessel Multi-Float Systems
- Multi-Robot Coordination Analysis, Taxonomy, Challenges and Future Scope
  16 April 2021 | Journal of Intelligent & Robotic Systems, Vol. 102, No. 1
- Multi-agent reinforcement learning algorithm to solve a partially-observable multi-agent problem in disaster response
  European Journal of Operational Research, Vol. 291, No. 1
- Forward and Backward Bellman Equations Improve the Efficiency of the EM Algorithm for DEC-POMDP
  29 April 2021 | Entropy, Vol. 23, No. 5
- Maximizing network throughput by cooperative reinforcement learning in clustered solar-powered wireless sensor networks
  1 April 2021 | International Journal of Distributed Sensor Networks, Vol. 17, No. 4
- Active Sensing for Space Habitat Environmental Monitoring and Anomaly Detection
- Hybrid Dec-POMDP/PID Guidance System for Formation Flight of Multiple UAVs
  10 March 2021 | Journal of Intelligent & Robotic Systems, Vol. 101, No. 3
- Information and Communication Complexity of Networked Control Systems
  4 August 2021
- Multi-Agent Reinforcement Learning: A Selective Overview of Theories and Algorithms
  24 June 2021
- A Review of Dynamic Scheduling: Context, Techniques and Prospects
  4 April 2021
- Multi-agent Planning with High-Level Human Guidance
  14 February 2021
- Policy Advisory Module for Exploration Hindrance Problem in Multi-agent Deep Reinforcement Learning
  14 February 2021
- A Multi-branch Ensemble Agent Network for Multi-agent Reinforcement Learning
  30 October 2021
- Active Environmental Monitoring and Anomaly Search System for Space Habitat With Markov Decision Process and Active Sensing
  IEEE Access, Vol. 9
- Contextual Bandit Learning With Reward Oracles and Sampling Guidance in Multi-Agent Environments
  IEEE Access, Vol. 9
- Quantifying the impact of non-stationarity in reinforcement learning-based traffic signal control
  27 May 2021 | PeerJ Computer Science, Vol. 7
- Information State Embedding in Partially Observable Cooperative Multi-Agent Reinforcement Learning
- Motion-encoded particle swarm optimization for moving target search using UAVs
  Applied Soft Computing, Vol. 97
- Multi-Agent Reinforcement Learning for Cooperative Adaptive Cruise Control
- Answerable and Unanswerable Questions in Risk Analysis with Open‐World Novelty
  30 September 2020 | Risk Analysis, Vol. 40, No. S1
- Decentralised Self-Organising Maps for Multi-Robot Information Gathering
- Scaling Up Multiagent Reinforcement Learning for Robotic Systems: Learn an Adaptive Sparse Communication Graph
- With Whom to Communicate: Learning Efficient Communication for Multi-Robot Collision Avoidance
- Multi-agent active information gathering in discrete and continuous-state decentralized POMDPs by policy graph improvement
  10 June 2020 | Autonomous Agents and Multi-Agent Systems, Vol. 34, No. 2
- Deep Teams: Decentralized Decision Making With Finite and Infinite Number of Agents
  IEEE Transactions on Automatic Control, Vol. 65, No. 10
- Multi-Agent Deep Reinforcement Learning for Traffic optimization through Multiple Road Intersections using Live Camera Feed
- Exploring communication protocols and centralized critics in multi-agent deep learning
  Integrated Computer-Aided Engineering, Vol. 27, No. 4
- Decentralized task allocation for multiple UAVs with task execution uncertainties
- An Approach for Multi-UAV System Navigation and Target Finding in Cluttered Environments
- AirScope: Mobile Robots-Assisted Cooperative Indoor Air Quality Sensing by Distributed Deep Reinforcement Learning
  IEEE Internet of Things Journal, Vol. 7, No. 9
- Reinforcement Learning in Deep Structured Teams: Initial Results with Finite and Infinite Valued Features
- Privacy stochastic games in distributed constraint reasoning
  11 April 2019 | Annals of Mathematics and Artificial Intelligence, Vol. 88, No. 7
- An optimal policy for joint compression and transmission control in delay-constrained energy harvesting IoT devices
  Computer Communications, Vol. 160
- Multi-Agent Pattern Formation: a Distributed Model-Free Deep Reinforcement Learning Approach
- The Colliding Reciprocal Dance Problem: A Mitigation Strategy with Application to Automotive Active Safety Systems
- UAV Autonomous Aerial Combat Maneuver Strategy Generation with Observation Error Based on State-Adversarial Deep Deterministic Policy Gradient and Inverse Reinforcement Learning
  10 July 2020 | Electronics, Vol. 9, No. 7
- Decentralized Decision Making for the Restoration of Interdependent Networks
  ASCE-ASME Journal of Risk and Uncertainty in Engineering Systems, Part A: Civil Engineering, Vol. 6, No. 2
- Fast Q-Learning for Improved Finite Length Performance of Irregular Repetition Slotted ALOHA
  IEEE Transactions on Cognitive Communications and Networking, Vol. 6, No. 2
- Optimization for Reinforcement Learning: From a single agent to cooperative agents
  IEEE Signal Processing Magazine, Vol. 37, No. 3
- Multi-objective multi-agent decision making: a utility-based analysis and survey
  9 December 2019 | Autonomous Agents and Multi-Agent Systems, Vol. 34, No. 1
- The impact of agent definitions and interactions on multiagent learning for coordination in traffic management domains
  21 January 2020 | Autonomous Agents and Multi-Agent Systems, Vol. 34, No. 1
- Learning multi-agent communication with double attentional deep reinforcement learning
  25 March 2020 | Autonomous Agents and Multi-Agent Systems, Vol. 34, No. 1
- Simultaneous Policy and Discrete Communication Learning for Multi-Agent Cooperation
  IEEE Robotics and Automation Letters, Vol. 5, No. 2
- Cooperative Multi-Agent Reinforcement Learning with Conversation Knowledge for Dialogue Management
  15 April 2020 | Applied Sciences, Vol. 10, No. 8
- Cooperative Queuing Policies for Effective Scheduling of Operator Intervention
  15 July 2019 | Autonomous Robots, Vol. 44, No. 3-4
- The Hanabi challenge: A new frontier for AI research
  Artificial Intelligence, Vol. 280
- Dark, Beyond Deep: A Paradigm Shift to Cognitive AI with Humanlike Common Sense
  Engineering, Vol. 6, No. 3
- Reinforcement learning for control of flexibility providers in a residential microgrid
  12 November 2019 | IET Smart Grid, Vol. 3, No. 1
- Information and Communication Complexity of Networked Control Systems
  3 January 2020
- Blockchain Approach to Solve Collective Decision Making Problems for Swarm Robotics
  25 June 2019
- Deep Multi Agent Reinforcement Learning for Autonomous Driving
  6 May 2020
- Online Decentralized and Cooperative Dispatch for Multi-Microgrids
  IEEE Transactions on Automation Science and Engineering, Vol. 17, No. 1
- Mobile delay‐tolerant networks with energy‐harvesting and wireless energy transfer cooperation
  26 December 2018 | Concurrency and Computation: Practice and Experience, Vol. 31, No. 24
- Safe Policy Synthesis in Multi-Agent POMDPs via Discrete-Time Barrier Functions
- Bayesian Reinforcement Learning for Multi-Robot Decentralized Patrolling in Uncertain Environments
  IEEE Transactions on Vehicular Technology, Vol. 68, No. 12
- A survey and critique of multiagent deep reinforcement learning
  16 October 2019 | Autonomous Agents and Multi-Agent Systems, Vol. 33, No. 6
- Research on Learning Method Based on Hierarchical Decomposition
- Coordination in Adversarial Multi-Agent with Deep Reinforcement Learning Under Partial Observability
- Stochastic multi-agent planning with partial state models
  13 October 2019
- Cumulative Training and Transfer Learning for Multi-Robots Collision-Free Navigation Problems
- ML-based Reinforcement Learning Approach for Power Management in SoCs
- iX-BSP: Belief Space Planning through Incremental Expectation
- Delay-Optimal Traffic Engineering through Multi-agent Reinforcement Learning
- Multi-Agent Planning under Uncertainty with Monte Carlo Q-Value Function
  4 April 2019 | Applied Sciences, Vol. 9, No. 7
- Solving partially observable agent‐intruder games with an application to border security problems
  10 March 2019 | Naval Research Logistics (NRL), Vol. 66, No. 2
- Dec-MCTS: Decentralized planning for multi-robot active perception
  8 March 2018 | The International Journal of Robotics Research, Vol. 38, No. 2-3
- Cooperative Multi-agent Policy Gradient
  18 January 2019
- FMNet: Multi-agent Cooperation by Communicating with Featured Message Network
  9 September 2019
- Planning and acting framework under robot operating system
  30 November 2018 | IOP Conference Series: Materials Science and Engineering, Vol. 433
- Monte-Carlo Planning for Team Re-Formation Under Uncertainty: Model and Properties
- On the relationship between dynamics and complexity in multi-agent collision avoidance
  23 April 2018 | Autonomous Robots, Vol. 42, No. 7
- Planning for cars that coordinate with people: leveraging effects on human actions for planning and active information gathering over human internal state
  4 May 2018 | Autonomous Robots, Vol. 42, No. 7
- Multi-robot inverse reinforcement learning under occlusion with estimation of state transitions
  Artificial Intelligence, Vol. 263
- Inverse Learning of Robot Behavior for Collaborative Planning
- Dynamic process scheduling and resource allocation in distributed environment: an agent-based modelling and simulation
  3 September 2018 | Mathematical and Computer Modelling of Dynamical Systems, Vol. 24, No. 5
- A simulation-based neighbourhood search algorithm to schedule multi-category patients at a multi-facility health care diagnostic centre
  20 November 2017 | Health Systems, Vol. 7, No. 3
- Probabilistic bisimulation for realistic schedulers
  24 February 2018 | Acta Informatica, Vol. 55, No. 6
- Simultaneous Search and Monitoring of Evasive Targets by an Unmanned Aerial Vehicle
- Decentralized Reinforcement Learning Based MAC Optimization
- On Distributed Optimization for Supply Demand Coordination in Cyber Physical Energy Systems
- A Survey on Aerial Swarm Robotics
  IEEE Transactions on Robotics, Vol. 34, No. 4
- Network-Model-Based vs. Network-Model-Free Approaches to Internet Congestion Control
- Learning option MDPs from small data
- Optimal Dynamic Pricing for Binary Demands in Smart Grids: A Fair and Privacy-Preserving Strategy
- Topological Multi-Robot Belief Space Planning in Unknown Environments
- Safe Markov Chains for ON/OFF Density Control With Observed Transitions
  IEEE Transactions on Automatic Control, Vol. 63, No. 5
- Decentralized multi-robot belief space planning in unknown environments via identification and efficient re-evaluation of impacted paths
  22 July 2017 | Autonomous Robots, Vol. 42, No. 4
- Reinforcement learning in a continuum of agents
  13 October 2017 | Swarm Intelligence, Vol. 12, No. 1
- Embodied Evolution in Collective Robotics: A Review
  22 February 2018 | Frontiers in Robotics and AI, Vol. 5
- Distributed Control Design for Balancing the Grid Using Flexible Loads
  1 June 2018
- Learning-Based Diagnosis and Repair
  25 February 2018
- Severity-sensitive norm-governed multi-agent planning
  7 July 2017 | Autonomous Agents and Multi-Agent Systems, Vol. 32, No. 1
- A Survey of Decision-Theoretic Models for Cognitive Internet of Things (CIoT)
  IEEE Access, Vol. 6
- CAPES
  12 November 2017
- DiagTree
  6 November 2017
- Open Decentralized POMDPs
- A Multiagent Planning Approach for Cooperative Patrolling with Non-Stationary Adversaries
  18 October 2017 | International Journal on Artificial Intelligence Tools, Vol. 26, No. 05
- Quantifying the impact of communication on performance in multi-agent teams
  1 June 2017 | Artificial Life and Robotics, Vol. 22, No. 3
- Learning for multi-robot cooperation in partially observable stochastic environments with macro-actions
- Can bounded and self-interested agents be teammates? Application to planning in ad hoc teams
  23 November 2016 | Autonomous Agents and Multi-Agent Systems, Vol. 31, No. 4
- Interactive POMDPs with finite-state models of other agents
  25 January 2017 | Autonomous Agents and Multi-Agent Systems, Vol. 31, No. 4
- Diagnosing resource usage failures in multi-agent systems
  Expert Systems with Applications, Vol. 77
- A role-based POMDPs approach for decentralized implicit cooperation of multiple agents
- Learning models of human-robot interaction from small data
- Information fusion analysis of multi-UAV system based on information geometry
- Controlling a Fleet of Unmanned Aerial Vehicles to Collect Uncertain Information in a Threat Environment
  Yan Xia,
  Rajan Batta,
  Rakesh Nagi
  11 April 2017 | Operations Research, Vol. 65, No. 3
- Infinite games with finite knowledge gaps
  Information and Computation, Vol. 254
- Smart Home Futures: Algorithmic Challenges and Opportunities
- Collaborative privacy preserving multi-agent planning
  22 March 2016 | Autonomous Agents and Multi-Agent Systems, Vol. 31, No. 3
- Multi-robot active information gathering with periodic communication
- Scalable accelerated decentralized multi-robot policy search in continuous observation spaces
- Semantic-level decentralized multi-robot decision-making using probabilistic macro-observations
- Towards efficient inference update through planning via JIP — Joint inference and belief space planning
- MT-LQG: Multi-agent planning in belief space via trajectory-optimized LQG
- Communication efficient decentralized Gaussian Process Fusion for multi-UAS path planning
- The Best-of-n Problem in Robot Swarms: Formalization, State of the Art, and Novel Perspectives
  13 March 2017 | Frontiers in Robotics and AI, Vol. 4
- Optimization methods to solve adaptive management problems
  24 October 2016 | Theoretical Ecology, Vol. 10, No. 1
- NUAV - a testbed for developing autonomous Unmanned Aerial Vehicles
- Creating Affective Autonomous Characters Using Planning in Partially Observable Stochastic Domains
  IEEE Transactions on Computational Intelligence and AI in Games, Vol. 9, No. 1
- Amazon in the White Space: Social Recommendation Aided Distributed Spectrum Access
  IEEE/ACM Transactions on Networking, Vol. 25, No. 1
- Decentralized control of multi-robot partially observable Markov decision processes using belief space macro-actions
  13 March 2017 | The International Journal of Robotics Research, Vol. 36, No. 2
- Multi-Objective Decision Making
  11 March 2022
- Discrete Consensus Achievement in Artificial Systems
  16 February 2017
- A robust approach to robot team learning
  28 November 2015 | Autonomous Robots, Vol. 40, No. 8
- Cooperative Decision-Making Under Uncertainties for Multi-Target Surveillance with Multiples UAVs
  7 September 2015 | Journal of Intelligent & Robotic Systems, Vol. 84, No. 1-4
- Self-adaptation in software-intensive cyber–physical systems: From system goals to architecture configurations
  Journal of Systems and Software, Vol. 122
- Efficient solutions of interactive dynamic influence diagrams using model identification
  Neurocomputing, Vol. 216
- Decentralized Patrolling Under Constraints in Dynamic Environments
  IEEE Transactions on Cybernetics, Vol. 46, No. 12
- Policy search for multi-robot coordination under uncertainty
  9 January 2017 | The International Journal of Robotics Research, Vol. 35, No. 14
- Cognitive Radio Networks with Wireless Energy Harvesting
- Planning and Coordination in Multiagent Environments
  16 November 2016
- Approximating behavioral equivalence for scaling solutions of I-DIDs
  30 December 2015 | Knowledge and Information Systems, Vol. 49, No. 2
- Markov Decision Processes With Applications in Wireless Sensor Networks: A Survey
  IEEE Communications Surveys & Tutorials, Vol. 17, No. 3
- Cooperative Multiagent Patrolling for Detecting Multiple Illegal Actions under Uncertainty
- Communication-efficient motion coordination and data fusion in information gathering teams
- Multi-robot decentralized belief space planning in unknown environments via efficient re-evaluation of impacted paths
- DisCSPs with Privacy Recast as Planning Problems for Self-Interested Agents
- A Real World Multi-UAV Evolutionary Planner for Minimum Time Target Detection
  20 July 2016
- Efficiency and fairness in team search with self-interested agents
  1 December 2015 | Autonomous Agents and Multi-Agent Systems, Vol. 30, No. 3
- Multi-agent reinforcement learning as a rehearsal for decentralized planning
  Neurocomputing, Vol. 190
- Decentralized heuristic access policy design for two cognitive secondary users under a primary Type-I HARQ process
- An MDP-based approximation method for goal constrained multi-MAV planning under action uncertainty
- Graph-based Cross Entropy method for solving multi-robot decentralized POMDPs
- Modeling and Algorithms for Multiagent Communication through Interactive Dynamic Influence Diagrams
  25 May 2016 | Applied Artificial Intelligence, Vol. 30, No. 4
- An extended version of opportunity cost algorithm for communication decisions
  23 September 2015 | Evolving Systems, Vol. 7, No. 1
- Health-Aware Multi-UAV Planning using Decentralized Partially Observable Semi-Markov Decision Processes
  1 January 2016
- Distributed Synthesis in Continuous Time
- Intelligent Behavior Modeling on Information Delivery of Time-Sensitive Targets
  22 September 2016
- Human–agent collaboration for disaster response
  20 February 2015 | Autonomous Agents and Multi-Agent Systems, Vol. 30, No. 1
- Agent-Based Modeling and Simulation of Coordination by Airline Operations Control
  IEEE Transactions on Emerging Topics in Computing, Vol. 4, No. 1
- Value of information for a leader–follower partially observed Markov game
  27 May 2015 | Annals of Operations Research, Vol. 235, No. 1
- A leader–follower partially observed, multiobjective Markov game
  7 July 2015 | Annals of Operations Research, Vol. 235, No. 1
- A DEC-MDP model for joint uplink/downlink resource management in OFDMA-based networks
  Physical Communication, Vol. 17
- Multiagent Learning of Coordination in Loosely Coupled Multiagent Systems
  IEEE Transactions on Cybernetics, Vol. 45, No. 12
- Decision-theoretic planning under uncertainty with information rewards for active cooperative perception
  23 December 2014 | Autonomous Agents and Multi-Agent Systems, Vol. 29, No. 6
- Continual planning for search and rescue robots
- Access Policy Design for Cognitive Secondary Users Under a Primary Type-I HARQ Process
  IEEE Transactions on Communications, Vol. 63, No. 11
- LTL-Based Planning in Environments With Probabilistic Observations
  IEEE Transactions on Automation Science and Engineering, Vol. 12, No. 4
- Multi-agent planning with joint actions
- Joint optimization of transmission and reception policies for energy harvesting nodes
- Performance Optimization for Cooperative Multiuser Cognitive Radio Networks with RF Energy Harvesting Capability
  IEEE Transactions on Wireless Communications, Vol. 14, No. 7
- Scalable solutions of interactive POMDPs using generalized and bounded policy iteration
  13 April 2014 | Autonomous Agents and Multi-Agent Systems, Vol. 29, No. 3
- Planning for decentralized control of multiple robots under uncertainty
- Decentralized control of Partially Observable Markov Decision Processes using belief space macro-actions
- ASCAR: Automating contention management for high-performance storage systems
- Evolutionary Robotics: What, Why, and Where to
  3 March 2015 | Frontiers in Robotics and AI, Vol. 2
- Concurrent Markov decision processes for robot team learning
  Engineering Applications of Artificial Intelligence, Vol. 39
- Cross-Layer Design of Distributed Sensing-Estimation With Quality Feedback— Part I: Optimal Schemes
  IEEE Transactions on Signal Processing, Vol. 63, No. 5
- Cross-Layer Design of Distributed Sensing-Estimation With Quality Feedback— Part II: Myopic Schemes
  IEEE Transactions on Signal Processing, Vol. 63, No. 5
- An experimental study of the learnability of congestion control
  17 August 2014 | ACM SIGCOMM Computer Communication Review, Vol. 44, No. 4
- Communication-aware information gathering with dynamic information flow
  15 December 2014 | The International Journal of Robotics Research, Vol. 34, No. 2
- Reinforcement Learning of Informed Initial Policies for Decentralized Planning
  8 December 2014 | ACM Transactions on Autonomous and Adaptive Systems, Vol. 9, No. 4
- Human Robot-Team Interaction
  25 June 2015
- Probabilistic Bisimulation for Realistic Schedulers
- Solving F $$^3$$ MDPs: Collaborative Multiagent Markov Decision Processes with Factored Transitions, Rewards and Stochastic Policies
  28 November 2015
- Towards a Taxonomy of Task-Oriented Domains of Dialogue
  28 November 2015
- Speeding up Planning in Multiagent Settings Using CPU-GPU Architectures
  19 December 2015
- The complexity of multi-agent plan recognition
  8 February 2014 | Autonomous Agents and Multi-Agent Systems, Vol. 29, No. 1
- Heuristics for multiagent reinforcement learning in decentralized decision problems
- Team optimal control of coupled subsystems with mean-field sharing
- An online learning approach to QoE-fair distributed rate allocation in multi-user video streaming
- Robot team learning enhancement using Human Advice
- Policy computation for constrained communicating agents
- Multi-UAV target search using decentralized gradient-based negotiation with expected observation
  Information Sciences, Vol. 282
- An experimental study of the learnability of congestion control
  17 August 2014
- A Survey of Multi-Agent Decision Making
  3 July 2014 | KI - Künstliche Intelligenz, Vol. 28, No. 3
- Converging to a player model in Monte-Carlo Tree Search
- Online planning for multi-agent systems with consensus protocol
- Optimal decentralized control policy for wireless communication systems with wireless energy transfer capability
- Decentralized cooperation of multiple UAS for multi-target surveillance under uncertainties
- Optimizing Spatial and Temporal Reuse in Wireless Networks by Decentralized Partially Observable Markov Decision Processes
  IEEE Transactions on Mobile Computing, Vol. 13, No. 4
- Cooperative bidding of data transmission and wireless energy transfer
- Coordinated learning by exploiting sparse interaction in multiagent systems
  18 October 2012 | Concurrency and Computation: Practice and Experience, Vol. 26, No. 1
- Distributed Decision-Theoretic Active Perception for Multi-robot Active Information Gathering
- Error-Bounded Approximations for Infinite-Horizon Discounted Decentralized POMDPs
- Decentralized Guidance Control of UAVs with Explicit Optimization of Communication
  27 September 2013 | Journal of Intelligent & Robotic Systems, Vol. 73, No. 1-4
- Decision-Theoretic Planning in Multiagent Settings with Application to Behavioral Modeling
- Repeated games for multiagent systems: a survey
  18 March 2013 | The Knowledge Engineering Review, Vol. 29, No. 1
- Modeling Collaborative Coordination Requires Anthropological Insights
  8 November 2013 | Topics in Cognitive Science, Vol. 6, No. 1
- Scalable $\epsilon$-Optimal Decision-Making and Stochastic Routing in Large Networks via Distributed Supervision of Probabilistic Automata
  SIAM Journal on Control and Optimization, Vol. 52, No. 4
- Applications of DEC-MDPs in Multi-Robot Systems
- Decentralized control of partially observable Markov decision processes
- On the structure of decentralized controllers in networked MDPs
- Coordinated Multi-Microgrids Optimal Control Algorithm for Smart Distribution Management System
  IEEE Transactions on Smart Grid, Vol. 4, No. 4
- ACTIDS
  4 November 2013
- Fusion center feedback for quasi-decentralized estimation in Sensor Networks
- TCP ex machina
  27 August 2013 | ACM SIGCOMM Computer Communication Review, Vol. 43, No. 4
- TCP ex machina
  27 August 2013
- Active Visual Planning for Mobile Robot Teams Using Hierarchical POMDPs
  IEEE Transactions on Robotics, Vol. 29, No. 4
- High-Level Mission Specification and Planning for Collaborative Unmanned Aircraft Systems Using Delegation
  20 June 2013 | Unmanned Systems, Vol. 01, No. 01
- A Multi-platform Sensor Coordinated Earth Observing Missions Scheduling Method for Hazard Monitoring
- Decentralized control of unmanned aerial vehicles for multitarget tracking
- Decentralized learning-based planning for multiagent missions in the presence of actuator failures
- Decentralized multi-robot cooperation with auctioned POMDPs
  7 June 2013 | The International Journal of Robotics Research, Vol. 32, No. 6
- Communication based on Interactive Dynamic Influence Diagrams in cooperative multi-agent systems
- Observer effect from stateful resources in agent sensing
  1 February 2012 | Autonomous Agents and Multi-Agent Systems, Vol. 26, No. 2
- Physical search problems with probabilistic knowledge
  Artificial Intelligence, Vol. 196
- Self-Organized Cooperation Policy Setting in P2P Systems Based on Reinforcement Learning
  IEEE Systems Journal, Vol. 7, No. 1
- Stochastic Games
  7 March 2013
- DEC‐MDP/POMDP
  7 March 2013
- Modeling information exchange opportunities for effective human–computer teamwork
  Artificial Intelligence, Vol. 195
- A Concise Introduction to Models and Methods for Automated Planning
  19 February 2022
- Heuristic Planning for Decentralized MDPs with Sparse Interactions
- Solving Multi-agent Decision Problems Modeled as Dec-POMDP: A Robot Soccer Case Study
- Expectation Maximization for Average Reward Decentralized POMDPs
- Bayesian-Game-Based Fuzzy Reinforcement Learning Control for Decentralized POMDPs
  IEEE Transactions on Computational Intelligence and AI in Games, Vol. 4, No. 4
- Exploring the Importance of Information Relevance, Ontology and Utilities for Scalable Multi-agent Coordination
- Decision Making in Complex Multiagent Contexts: A Tale of Two Frameworks
  1 December 2012 | AI Magazine, Vol. 33, No. 4
- Minimum time search for lost targets using cross entropy optimization
- Distributed Problem Solving
  1 September 2012 | AI Magazine, Vol. 33, No. 3
- A mean–variance optimization problem for discounted Markov decision processes
  European Journal of Operational Research, Vol. 220, No. 2
- A communication model for interactive POMDPs
- Scalable, MDP-based planning for multiple, cooperating agents
- Research progress in teamwork
- Exploiting symmetries for single- and multi-agent Partially Observable Stochastic Domains
  Artificial Intelligence, Vol. 182-183
- CTS 2012 tutorials
- Decentralized multi-robot cooperation with auctioned POMDPs
- Distributed value functions for multi-robot exploration
- Autonomic multi-policy optimization in pervasive systems
  4 May 2012 | ACM Transactions on Autonomous and Adaptive Systems, Vol. 7, No. 1
- Coordination of cooperation policies in a peer-to-peer system using swarm-based RL
  Journal of Network and Computer Applications, Vol. 35, No. 2
- Mixed Observability Markov Decision Processes for Overall Network Performance Optimization in Wireless Sensor Networks
- Environment-driven distributed evolutionary adaptation in a population of autonomous robotic agents
  Mathematical and Computer Modelling of Dynamical Systems, Vol. 18, No. 1
- Planning with Markov Decision Processes
  11 March 2022
- Bounded Rationality in Multiagent Systems Using Decentralized Metareasoning
- Partially Observable Markov Decision Processes
- Decentralized POMDPs
- Batch Reinforcement Learning
- A Convergent Multiagent Reinforcement Learning Approach for a Subclass of Cooperative Stochastic Games
- Multiagent Decision by Partial Evaluation
- Exploiting Independent Relationships in Multiagent Systems for Coordinated Learning
- Q-Tree: Automatic Construction of Hierarchical State Representation for Reinforcement Learning
- Using Markov Decision Processes to define an adaptive strategy to control the spread of an animal disease
  Computers and Electronics in Agriculture, Vol. 80
- Distributed policy search reinforcement learning for job-shop scheduling tasks
  16 June 2011 | International Journal of Production Research, Vol. 50, No. 1
- Applications of DEC-MDPs in Multi-Robot Systems
- Hierarchical State Representation and Action Abstractionsin Q-Learning for Agent-Based Herding
  International Journal of Information and Electronics Engineering, Vol. 27
- MULTIAGENT EXPEDITION WITH GRAPHICAL MODELS
  25 January 2012 | International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, Vol. 19, No. 06
- Solving efficiently Decentralized MDPs with temporal and resource constraints
  14 July 2010 | Autonomous Agents and Multi-Agent Systems, Vol. 23, No. 3
- Collective Decision-Theoretic Planning for Planet Exploration
- Distributed Coordination Guidance in Multi-agent Reinforcement Learning
- Recognizing and learning models of social exchange strategies for the regulation of social interactions in open agent societies
  6 August 2011 | Journal of the Brazilian Computer Society, Vol. 17, No. 3
- A finite horizon DEC-POMDP approach to multi-robot task learning
- Multi-Agent Planning for Persistent Missions with Automated Battery Management
  14 June 2011
- Hierarchical state-abstracted and socially augmented Q-Learning for reducing complexity in agent-based learning
  19 July 2011 | Journal of Control Theory and Applications, Vol. 9, No. 3
- Social Model Shaping for Solving Generic DEC-POMDPs
- Planning in stochastic domains for multiple agents with individual continuous resource state-spaces
  7 May 2010 | Autonomous Agents and Multi-Agent Systems, Vol. 23, No. 1
- Decentralized MDPs with sparse interactions
  Artificial Intelligence, Vol. 175, No. 11
- GODDeS: Globally ∈-Optimal Routing Via Distributed Decision-theoretic Self-organization
- Fuzzy reinforcement learning control for decentralized partially observable Markov decision processes
- Distributed Reinforcement Learning based MAC protocols for autonomous cognitive secondary users
- On the Power of Global Reward Signals in Reinforcement Learning
- A POMDP Model for Guiding Taxi Cruising in a Congested Urban City
- Cooperative Multi-Agent Reinforcement Learning for Multi-Component Robotic Systems: guidelines for future research
  Paladyn, Journal of Behavioral Robotics, Vol. 2, No. 2
- A dynamic programming algorithm for decentralized Markov decision processes with a broadcast structure
- Coordinated learning in multiagent MDPs with infinite state-space
  20 August 2009 | Autonomous Agents and Multi-Agent Systems, Vol. 21, No. 3
- On the Problem of Recognizing and Learning Observable Social Exchange Strategies in Open Societies
- Socially augmented hierarchical reinforcement learning for reducing complexity in cooperative multi-agent systems
- Collaborative Function Approximation in Social Multiagent Systems
- A Rich Communication Model in Opportunistic Decentralized Decision Making
- Co-evolutionary search path planning under constrained information-sharing for a cooperative unmanned aerial vehicle team
- A Bayesian game based adaptive fuzzy controller for multiagent POMDPs
- Synergizing reinforcement learning and game theory—A new direction for control
  Applied Soft Computing, Vol. 10, No. 3
- A PGM framework for recursive modeling of players in simple sequential Bayesian games
  International Journal of Approximate Reasoning, Vol. 51, No. 5
- Exploiting domain knowledge in planning for uncertain robot systems modeled as POMDPs
- Markov Decision Process-Based Resource and Information Management for Sensor Networks
  30 October 2009
- A Decision-Theoretic Approach to Collaboration: Principal Description Methods and Efficient Heuristic Approximations
- Point-Based Bounded Policy Iteration for Decentralized POMDPs
- A Log-Ratio Information Measure for Stochastic Sensor Management
- Delay-sensitive distributed power and transmission threshold control for S-ALOHA network with finite state markov fading channels
  IEEE Transactions on Wireless Communications, Vol. 8, No. 11
- Military network security using self organized multi-agent entangled hierarchies
  8 July 2009
- Self organized multi-agent entangled hierarchies for network security
  8 July 2009
- Cooperative Decision-Making in Decentralized Multiple-Robot Systems: The Best-of-N Problem
  IEEE/ASME Transactions on Mechatronics, Vol. 14, No. 2
- Network security using self organized multi agent swarms
- ANALYZING MYOPIC APPROACHES FOR MULTI‐AGENT COMMUNICATION
  2 February 2009 | Computational Intelligence, Vol. 25, No. 1
- Contribution to the Control of a MAS’s Global Behaviour: Reinforcement Learning Tools
- Modeling User Perception of Interaction Opportunities for Effective Teamwork
- Globally Optimal Multi-agent Reinforcement Learning Parameters in Distributed Task Assignment
- Offline Planning for Communication by Exploiting Structured Interactions in Decentralized MDPs
- Agent Influence and Intelligent Approximation in Multiagent Problems
- Myopic and Non-myopic Communication under Partial Observability
- Introducing Communication in Dis-POMDPs with Locality of Interaction
- Formal models and algorithms for decentralized decision making under uncertainty
  14 February 2008 | Autonomous Agents and Multi-Agent Systems, Vol. 17, No. 2
- Leveraging Organizational Guidance Policies with Learning to Self-Tune Multiagent Systems
- Using quantitative models to search for appropriate organizational designs
  30 November 2007 | Autonomous Agents and Multi-Agent Systems, Vol. 16, No. 2
- Approximation of Expected Reward Value in MMDP
- Solving Large-Scale and Sparse-Reward DEC-POMDPs with Correlation-MDPs
- A Cross-Entropy Approach to Solving Dec-POMDPs
- Joint Equilibrium Policy Search for Multi-Agent Scheduling Problems
- Towards the Self-regulation of Personality-Based Social Exchange Processes in Multiagent Systems
- Evaluation of Batch-Mode Reinforcement Learning Methods for Solving DEC-MDPs with Changing Action Sets
- Information state for Markov decision processes with network delays
- Solving decentralized multi-agent control problems with genetic algorithms
- UAV Team Decision and Control Using Efficient Collaborative Estimation
  21 April 2007 | Journal of Dynamic Systems, Measurement, and Control, Vol. 129, No. 5
- Shaping multi-agent systems with gradient reinforcement learning
  10 January 2007 | Autonomous Agents and Multi-Agent Systems, Vol. 15, No. 2
- Local strategy learning in networked multi-agent team formation
  13 May 2006 | Autonomous Agents and Multi-Agent Systems, Vol. 15, No. 1
- Learning to communicate in a decentralized environment
  25 May 2006 | Autonomous Agents and Multi-Agent Systems, Vol. 15, No. 1
- Exploiting factored representations for decentralized execution in multiagent teams
  14 May 2007
- Q-value functions for decentralized POMDPs
  14 May 2007
- Distributed intrusion detection in partially observable Markov decision processes
  14 May 2007
- Subjective approximate solutions for decentralized POMDPs
  14 May 2007
- Modeling plan coordination in multiagent decision processes
  14 May 2007
- Architecture and Design of a Multi-Layered Cooperative Adaptive Cruise Control System
  16 April 2007
- Coordinated Reinforcement Learning for Decentralized Optimal Control
- Solving Multi-agent Control Problems Using Particle Swarm Optimization
- A Concise Introduction to Multiagent Systems and Distributed Artificial Intelligence
  11 March 2022
- Solving Decentralized Continuous Markov Decision Problems with Structured Reward
- Optimal control of distributed Markov decision processes with network delays
- Multi-Agent Handling of Opportunism: AWOL Meets Discretized `Unreal Tournament'
- Playing games in many possible worlds
  11 June 2006
- Decentralized planning under uncertainty for teams of communicating agents
  8 May 2006
- Stochastic planning for weakly-coupled distributed agents
  8 May 2006
- Agent interaction in distributed POMDPs and its implications on complexity
  8 May 2006
- Communication management using abstraction in distributed Bayesian networks
  8 May 2006
- Exact solutions of interactive POMDPs using behavioral equivalence
  8 May 2006
- Multi-agent Cooperative Learning Research Based on Reinforcement Learning
- Techniques for Robust Planning in Degradable Multiagent Systems
- An Overview of Cooperative and Competitive Multiagent Learning
- The Complexity of Finding an Optimal Policy for Language Convergence
- System Maps: A Data Driven Model for Systems of Systems
  15 June 2005
- Multiagent coordination by Extended Markov Tracking
  25 July 2005
- Communication management using abstraction in distributed bayesian networks
  25 July 2005
- An Optimal Best-First Search Algorithm for Solving Infinite Horizon DEC-POMDPs
- Analyzing Myopic Approaches for Multi-Agent Communication
- Modeling and simulating human teamwork behaviors using intelligent agents
  Physics of Life Reviews, Vol. 1, No. 3
- Improving coordination with communication in multi-agent reinforcement learning
- Transition-independent decentralized markov decision processes
  14 July 2003
- Optimizing information exchange in cooperative multi-agent systems
  14 July 2003
- Minimizing communication cost in a distributed Bayesian network using a decentralized MDP
  14 July 2003
- The complexity of multiagent systems
  14 July 2003
- On the role of multiply sectioned bayesian networks to cooperative multiagent systems
  IEEE Transactions on Systems, Man, and Cybernetics - Part A: Systems and Humans, Vol. 33, No. 4

cover image Mathematics of Operations Research

Volume 27, Issue 4

November 2002

Pages 637-842

Article Information

Metrics

Information

Received:August 11, 2000
Published Online:November 01, 2002

Cite as

Daniel S. Bernstein, Robert Givan, Neil Immerman, Shlomo Zilberstein, (2002) The Complexity of Decentralized Control of Markov Decision Processes. Mathematics of Operations Research 27(4):819-840.

https://doi.org/10.1287/moor.27.4.819.297

Keywords

PDF download

Available Issues

Available Issues

Available Issues

Available Issues

Available Issues

Available Issues

Available Issues

The Complexity of Decentralized Control of Markov Decision Processes

References

Volume 27, Issue 4

Article Information

Metrics

Information

Cite as

Keywords

Sign Up for INFORMS Publications Updates and News