LLM2D
逻辑树:结构化的证明探索,用于大型语言模型的连贯且严谨的逻辑推理
LogicTree: Structured Proof Exploration for Coherent and Rigorous Logical Reasoning with Large Language Models
作者: Kang He, Kaushik Roy
发布日期: 4/22/2025
arXiv ID: oai:arXiv.org:2504.14089v1

摘要

arXiv:2504.14089v1 类型: cross 摘要:大型语言模型(LLMs)在各个领域中已经实现了令人瞩目的多步推理能力。然而,LLMs 在复杂的逻辑推理中仍然面临独特的挑战,具体表现为:(1)寻找证明需要系统性的探索和保持逻辑连贯性;(2)在包含大量前提的任务中,在每一步推理时找到合适的前提组合是固有的挑战。为了解决这些问题,我们提出了 LogicTree,这是一种推理时模块化框架,利用算法引导的搜索来自动化结构化的证明探索并确保逻辑连贯性。超越了思维树(ToT),我们将在 LogicTree 中加入缓存机制,以有效利用历史知识,防止推理停滞并减少冗余。此外,我们通过将前提搜索拆解为线性过程来解决前提搜索的组合复杂性。细化的前提选择限制了后续推理每一步最多只有一个演绎,增强了推理的粒度并强制实施严格的步步为营的推理。此外,我们引入了两种 LLM 完全自由的启发式方法,以实现优先级战略的证明搜索。在五个数据集上的实验结果表明,LogicTree 最优地扩展了推理时间的计算,实现了更高的证明准确性,分别在 GPT-4o 上相较于链式思维(CoT)和思维树(ToT)平均提高了 23.6% 和 12.5%。此外,在 LogicTree 中,GPT-4o 平均优于 o3-mini 7.6%。