摘要
arXiv:2505.02322v1 宣告类型: 新
摘要:近期的进展显著提升了大型语言模型(LLMs)在处理复杂推理任务上的性能,在数学和逻辑推理等领域取得了显着的成功。然而,这些方法在处理复杂规划任务时遇到了挑战,主要原因在于推理步骤的延长、多样化的约束以及处理多个独立子任务的困难。为了解决这些挑战,我们提出了超树规划(HyperTree Planning, HTP)这一全新的推理范式,通过构建超树结构的规划大纲来实现有效的规划。超树结构允许LLMs通过灵活运用分而治之的策略进行层次化思考,有效地分解复杂的推理步骤,容纳多样化的约束,并以有条理的方式管理多个独立的子任务。我们还介绍了一种自主规划框架,该框架通过迭代细化和扩展超树结构的规划大纲来完成规划过程。实验结果表明,HTP的有效性,使用Gemini-1.5-Pro在TravelPlanner基准测试上达到了最先进的准确率,相比o1-preview性能提高了3.6倍。