摘要
近年来,研究人员致力于构建用于开放世界环境(如 Minecraft)的通用代理。尽管取得了令人鼓舞的结果,但现有工作主要集中在解决基本程序性任务上,例如按照 Minecraft 技术树收集材料和制作工具,将获取钻石任务视为最终目标。这种局限性源于代理可用的行动范围狭窄,要求它们从头开始学习有效的长范围策略。因此,在开放世界中发现各种游戏机会变得具有挑战性。在这项工作中,我们介绍了 Odyssey,这是一个新的框架,它赋予基于大型语言模型 (LLM) 的代理开放世界技能,以探索广阔的 Minecraft 世界。Odyssey 包含三个关键部分:(1)具有开放世界技能库的交互式代理,该库包含 40 种原始技能和 183 种组合技能。(2)一个经过微调的 LLaMA-3 模型,在来自 Minecraft Wiki 的 390k+ 指令条目的大型问答数据集上进行训练。(3)一个新的代理能力基准,包括长期规划任务、动态即时规划任务和自主探索任务。大量实验表明,提出的 Odyssey 框架可以有效地评估基于 LLM 的代理的不同能力。所有数据集、模型权重和代码均公开可用,以激励未来对更先进的自主代理解决方案的研究。