摘要
逻辑阅读理解是一项具有挑战性的任务,它要求理解文本的潜在语义并应用推理来得出正确答案。先前的研究主要通过思维链(Chain-of-Thought, CoT)或数据增强来提升逻辑推理能力。然而,以往构建思维链理由的工作主要集中在分析正确选项上,忽略了错误选项。此外,早期通过改变上下文进行数据增强的努力依赖于基于规则的方法,导致生成的上下文缺乏多样性和连贯性。为了解决这些问题,我们提出了一种前提导向的数据增强(Premise-Oriented Data Augmentation, PODA)框架。该框架能够生成包含正确和错误选项分析的CoT理由,同时从错误候选选项中构建多样且高质量的反事实上下文。我们将总结前提和识别每个选项的前提纳入理由中。随后,我们使用识别出的前提进行多步提示,以构建反事实上下文。为了增强模型区分每个选项相关推理过程的能力,我们引入了一种新的思维路径对比学习方法,该方法比较原始样本和反事实样本之间的推理路径。在三个代表性的大型语言模型(LLMs)上的实验结果表明,我们的方法在两个具有挑战性的逻辑推理基准(ReClor和LogiQA 2.0)上显著提升了基线水平。数据和代码已在https://github.com/lalalamdbf/TPReasoner发布。