LLM2D
MindForge:赋能具身智能体,使其具备心智理论,实现终身协作学习
MindForge: Empowering Embodied Agents with Theory of Mind for Lifelong Collaborative Learning
作者: Mircea Lic\u{a}, Ojas Shirekar, Baptiste Colle, Chirag Raman
发布日期: 11/26/2024
arXiv ID: oai:arXiv.org:2411.12977v2

摘要

当代具身智能体,例如 Minecraft 中的 Voyager,已在开放式个体学习中展现出令人鼓舞的能力。然而,当配备大型开放语言模型 (LLM) 时,即使经过特定领域知识的微调,这些智能体也常常难以完成基本任务。受人类文化学习的启发,我们提出了 \collabvoyager,这是一个新颖的框架,它通过显式的视角转换增强了 Voyager 的终身协作学习能力。\collabvoyager 引入了三个关键创新:(1)将感知、信念、愿望和行动联系起来的思维理论表征;(2)智能体之间的自然语言交流;以及(3)任务和环境知识的语义记忆以及协作事件的情景记忆。这些进步使智能体能够推断自己和他人的心理状态,从而从经验上解决了两种普遍的失败模式:错误信念和错误的任务执行。在混合专业技能的 Minecraft 实验中,\collabvoyager 智能体优于 Voyager 对照组,收集一块泥土的任务完成率显著提高了 66.6%(+39.4%),收集一块木块的任务完成率显著提高了 70.8%(+20.8%)。它们表现出新兴行为,例如从专家智能体到新手智能体的知识转移和协作代码纠正。\collabvoyager 智能体还展示了通过使用先前通过协作获得的经验和信念来适应分布外任务的能力。在这个开放式社会学习范式中,\collabvoyager 为具身人工智能的民主发展铺平了道路,其中智能体在部署过程中可以从同伴和环境反馈中学习。