LLM2D
EMPOWER:具身多角色开放词汇规划,包含在线接地和执行
EMPOWER: Embodied Multi-role Open-vocabulary Planning with Online Grounding and Execution
作者: Francesco Argenziano, Michele Brienza, Vincenzo Suriani, Daniele Nardi, Domenico D. Bloisi
发布日期: 10/23/2024
arXiv ID: oai:arXiv.org:2408.17379v2

摘要

在现实环境中为机器人进行任务规划面临着重大挑战。这些挑战源于三个主要问题:难以识别实现目标的落地步骤序列;缺乏高级动作与低级指令之间标准化的映射;以及在机器人硬件资源有限的情况下保持低计算开销的挑战。我们介绍了 EMPOWER,这是一个为具身代理设计的开放词汇在线接地和规划框架,旨在解决这些问题。通过利用高效的预训练基础模型和多角色机制,EMPOWER 在落地规划和执行方面表现出显著的改进。定量结果突出了我们方法的有效性,使用 TIAGo 机器人在六种不同的现实场景中实现了平均 0.73 的成功率。