摘要
逻辑阅读理解是一项具有挑战性的任务,需要掌握文本的潜在语义并运用推理来推导出正确答案。之前的研究主要集中于通过思维链(CoT)或数据增强来提升逻辑推理能力。然而,以往构建思维链推理的工作仅关注于分析正确选项,忽略了错误选项。此外,早期通过改变上下文进行数据增强的努力依赖于基于规则的方法,导致生成的上下文缺乏多样性和连贯性。为了解决这些问题,我们提出了一种面向前提的数据增强(PODA)框架。该框架可以生成包含正确和错误选项分析的CoT推理,同时从错误候选选项中构建多样且高质量的反事实上下文。我们将总结前提和识别每个选项的前提整合到推理中。随后,我们使用多步提示与识别的前提来构建反事实上下文。为了增强模型更好地区分每个选项相关的推理过程的能力,我们引入了一种新的思路路径对比学习方法,比较原始样本和反事实样本之间的推理路径。三个代表性的大型语言模型的实验结果表明,我们的方法可以在两个具有挑战性的逻辑推理基准(ReClor和LogiQA 2.0)上显著提升基线性能。数据和代码发布在https://github.com/lalalamdbf/TPReasoner。