LLM2D

摘要

arXiv:2409.19471v2 宣告类型: replace-cross 摘要：尽管在大型语言模型（LLMs）方面取得了显著进展，这些模型增强了机器人代理对自然语言（NL）命令的理解和执行能力，但在确保代理遵守用户指定的约束方面仍存在挑战，尤其是对于复杂的命令和长期任务。为了应对这一挑战，我们提出了三种关键见解：等价投票、约束解码和领域特定微调，这些见解显著增强了LLM规划者处理复杂任务的能力。等价投票通过从NL命令中生成和采样多个线性时序逻辑（LTL）公式，聚类具有等效性的LTL公式，并选择大多数组的公式作为最终的LTL公式，以确保一致性。约束解码然后使用生成的LTL公式强制实施自回归计划推理，确保生成的计划符合LTL。领域特定微调定制LLM以在特定任务域内生成安全且高效的计划。我们的方法，安全高效大型语言模型规划器（SELP），结合了这些见解，创建了LLM规划者，以高信心度生成遵循用户命令的计划。我们在不同机器人代理和任务（包括无人机导航和机器人操作）中证明了SELP的有效性和普适性。对于无人机导航任务，SELP在安全性率（即完成符合自然语言命令的任务）方面比最新的规划器高出10.8%，在计划效率方面高出19.8%。对于机器人操作任务，SELP在安全性率方面取得了20.4%的提升。我们的用于评估NL到LTL和机器人任务规划的数据集将在github.com/lt-asset/selp公开发布。