LLM2D

摘要

arXiv:2011.00583v4 宣告类型: replace-cross 摘要: 在AlphaGo系列取得显著成功之后，多智能体强化学习(MARL)技术取得了显著进展。MARL对应的是多智能体系统中多个智能体同时学习的学习问题。它是一个历史悠久的跨学科领域，包括博弈论、机器学习、随机控制、心理学和最优化。虽然MARL在解决现实世界游戏方面取得了相当可观的实际成功，但文献中缺乏一个可以全面阐述现代MARL方法的博弈论基础并总结近期进展的自包含概述。事实上，现有大多数综述文章都是过时的，并且没有充分涵盖自2010年以来的最新进展。在这项工作中，我们提供了一本综述性论文，涵盖了从基础到最新发展的研究前沿内容。我们的综述性论文的目标是从博弈论的角度提供当前最先进的MARL技术的自包含评估。我们希望这项工作能够为新进的快速发展的这一领域的研究者提供一个踏脚石，同时，也为希望从近期进展中获得全景视图并识别新方向的现有领域专家提供帮助。