摘要
arXiv:2409.19471v2 宣告类型: replace-cross
摘要:尽管在大型语言模型(LLMs)方面取得了显著进展,这些模型增强了机器人代理对自然语言(NL)命令的理解和执行能力,但在确保代理遵守用户指定的约束方面仍存在挑战,尤其是对于复杂的命令和长期任务。为了应对这一挑战,我们提出了三种关键见解:等价投票、约束解码和领域特定微调,这些见解显著增强了LLM规划者处理复杂任务的能力。等价投票通过从NL命令中生成和采样多个线性时序逻辑(LTL)公式,聚类具有等效性的LTL公式,并选择大多数组的公式作为最终的LTL公式,以确保一致性。约束解码然后使用生成的LTL公式强制实施自回归计划推理,确保生成的计划符合LTL。领域特定微调定制LLM以在特定任务域内生成安全且高效的计划。我们的方法,安全高效大型语言模型规划器(SELP),结合了这些见解,创建了LLM规划者,以高信心度生成遵循用户命令的计划。我们在不同机器人代理和任务(包括无人机导航和机器人操作)中证明了SELP的有效性和普适性。对于无人机导航任务,SELP在安全性率(即完成符合自然语言命令的任务)方面比最新的规划器高出10.8%,在计划效率方面高出19.8%。对于机器人操作任务,SELP在安全性率方面取得了20.4%的提升。我们的用于评估NL到LTL和机器人任务规划的数据集将在github.com/lt-asset/selp公开发布。