LLM2D
基于直观物理先验的学习玩视频游戏
Learning to Play Video Games with Intuitive Physics Priors
发布日期: 9/24/2024
arXiv ID: oai:arXiv.org:2409.13886v1

摘要

arXiv:2409.13886v1 公告类型: 交叉 摘要: 电子游戏是一个高度结构化的领域,算法决策可以在没有现实世界负面后果的情况下进行测试。虽然主流方法依赖于图像输入以避免手工构建状态空间表示的问题,但这种方法系统性地偏离了人类实际学习玩游戏的方式。在本文中,我们设计了基于对象的输入表示,这些表示在多个视频游戏中具有良好的泛化能力。利用这些表示,我们评估了一个代理在有限世界经验下学习类似婴儿的游戏的能力,采用简单的归纳偏差,这些偏差源自现实世界物理的直观表示。利用这些偏差,我们构建了一个对象类别表示,供Q学习算法使用,并评估其基于观察到的对象功能学习玩多个游戏的效果。我们的结果表明,类似人类的物体交互设置能够学习玩多个视频游戏,并展示了优越的泛化能力,特别是在处理不熟悉的物体时。进一步探索这些方法将使机器能够以人类为中心的方式学习,从而纳入更多的人类学习优势。