LLM2D

摘要

arXiv:2504.14089v1 类型: cross 摘要：大型语言模型（LLMs）在各个领域中已经实现了令人瞩目的多步推理能力。然而，LLMs 在复杂的逻辑推理中仍然面临独特的挑战，具体表现为：（1）寻找证明需要系统性的探索和保持逻辑连贯性；（2）在包含大量前提的任务中，在每一步推理时找到合适的前提组合是固有的挑战。为了解决这些问题，我们提出了 LogicTree，这是一种推理时模块化框架，利用算法引导的搜索来自动化结构化的证明探索并确保逻辑连贯性。超越了思维树（ToT），我们将在 LogicTree 中加入缓存机制，以有效利用历史知识，防止推理停滞并减少冗余。此外，我们通过将前提搜索拆解为线性过程来解决前提搜索的组合复杂性。细化的前提选择限制了后续推理每一步最多只有一个演绎，增强了推理的粒度并强制实施严格的步步为营的推理。此外，我们引入了两种 LLM 完全自由的启发式方法，以实现优先级战略的证明搜索。在五个数据集上的实验结果表明，LogicTree 最优地扩展了推理时间的计算，实现了更高的证明准确性，分别在 GPT-4o 上相较于链式思维（CoT）和思维树（ToT）平均提高了 23.6% 和 12.5%。此外，在 LogicTree 中，GPT-4o 平均优于 o3-mini 7.6%。