LLM2D
Home
Arxiv
返回列表
通过单人游戏知识迁移提升双人游戏性能:基于Atari 2600游戏的实证研究
Enhancing Two-Player Performance Through Single-Player Knowledge Transfer: An Empirical Study on Atari 2600 Games
作者:
Kimiya Saadat, Richard Zhao
发布日期:
10/23/2024
arXiv ID:
oai:arXiv.org:2410.16653v1
摘要
利用强化学习和自我博弈进行二人游戏训练可能具有挑战性,因为二人环境复杂且训练过程可能不稳定。我们提出,如果强化学习算法能够利用同一游戏的单人版知识,则可以在二人游戏中更有效地进行训练并取得更好的性能。本研究使用雅达利2600 RAM作为输入状态,在十个不同的雅达利2600环境中检验了这一想法。我们讨论了从单人训练过程进行迁移学习相对于从头开始在二人环境中进行训练的优势,并在训练时间和平均总奖励等几个指标中展示了我们的结果。我们还讨论了一种计算RAM复杂度及其与性能关系的方法。
查看原文
下载 PDF