摘要
语言模型 (LMs) 具有强大的理解自然语言的能力,使其能够有效地将人类指令翻译成用于简单机器人任务的详细计划。然而,处理长时域任务仍然是一个重大挑战,特别是在合作异构机器人团队的子任务识别和分配方面。为了解决这个问题,我们提出了一种语言模型驱动的多智能体 PDDL 规划器 (LaMMA-P),这是一种新颖的多智能体任务规划框架,在长时域任务上取得了最先进的性能。LaMMA-P 集成了 LMs 的推理能力和传统启发式搜索规划器的优势,以实现高成功率和效率,同时展现出跨任务的强大泛化能力。此外,我们创建了 MAT-THOR,一个综合基准,其特点是基于 AI2-THOR 环境的两种不同复杂程度的家务任务。实验结果表明,LaMMA-P 比现有的基于 LM 的多智能体规划器实现了 105% 的更高成功率和 36% 的更高效率。本工作的实验视频、代码和数据集以及每个模块中使用的详细提示可在 https://lamma-p.github.io 获取。