摘要
arXiv:2411.12977v3 宣布类型: 修改
摘要: 当代由大规模语言模型(LLMs)驱动的具身代理,如Voyager,在像Minecraft这样的开放环境中的个体学习中展示了有希望的能力。然而,即使经过领域特定的微调,当由开源的LLMs驱动时,它们在基本任务上仍然面临挑战。我们提出了MindForge,这是一种通过明确的视角切换实现协作终身学习的生成性代理框架。我们介绍了三项关键创新:(1)一种结构化的理论思维表示,关联感知、信念、欲望和行为;(2)自然的代理间通信;以及(3)多组件记忆系统。在Minecraft实验中,使用开源权重LLMs的MindForge代理在传统Voyager(在没有GPT-4的情况下)无法完成的基本任务中展现出显著的优势,收集了2.3倍于Voyager的独特物品,并实现了3倍于Voyager的技术里程碑,从基本的木质工具进步到先进的铁制装备。MindForge代理展示了复杂的行为,包括专家-新手知识转移、协同问题解决以及通过累积的合作经验应对脱离分布的任务。MindForge通过开放式的社会学习促进具身AI的民主化发展,从而实现同伴间的知识共享。