LLM2D

摘要

行为树 (BT) 凭借其模块化、反应性和鲁棒性，正日益成为机器人技术中流行的控制结构。在 BT 生成方法方面，BT 规划在生成可靠的 BT 方面显示出前景。然而，BT 规划的可扩展性常常受到复杂场景中规划时间过长的限制，这很大程度上是由于缺乏领域知识。相比之下，预训练的大型语言模型 (LLM) 已在各个领域展现出任务推理能力，但其规划的正确性和安全性仍存在不确定性。本文提出将 BT 规划与 LLM 推理相结合，引入启发式行为树规划 (HBTP)——一个可靠且高效的 BT 生成框架。HBTP 的关键思想是利用 LLM 进行特定任务的推理以生成启发式路径，然后 BT 规划可以沿着该路径高效地展开。我们首先介绍启发式 BT 展开过程，以及分别针对最优规划和满意规划设计的两种启发式变体。然后，我们提出解决 LLM 推理不准确性的方法，包括动作空间剪枝和反思反馈，以进一步提高推理精度和规划效率。实验结果证明了 HBTP 的理论界限，来自四个数据集的结果证实了其在日常服务机器人应用中的实际有效性。