LLM2D

摘要

arXiv:2409.13886v1 公告类型: 交叉摘要: 电子游戏是一个高度结构化的领域，算法决策可以在没有现实世界负面后果的情况下进行测试。虽然主流方法依赖于图像输入以避免手工构建状态空间表示的问题，但这种方法系统性地偏离了人类实际学习玩游戏的方式。在本文中，我们设计了基于对象的输入表示，这些表示在多个视频游戏中具有良好的泛化能力。利用这些表示，我们评估了一个代理在有限世界经验下学习类似婴儿的游戏的能力，采用简单的归纳偏差，这些偏差源自现实世界物理的直观表示。利用这些偏差，我们构建了一个对象类别表示，供Q学习算法使用，并评估其基于观察到的对象功能学习玩多个游戏的效果。我们的结果表明，类似人类的物体交互设置能够学习玩多个视频游戏，并展示了优越的泛化能力，特别是在处理不熟悉的物体时。进一步探索这些方法将使机器能够以人类为中心的方式学习，从而纳入更多的人类学习优势。