LLM2D

摘要

逻辑阅读理解是一项具有挑战性的任务，需要掌握文本的潜在语义并运用推理来推导出正确答案。之前的研究主要集中于通过思维链（CoT）或数据增强来提升逻辑推理能力。然而，以往构建思维链推理的工作仅关注于分析正确选项，忽略了错误选项。此外，早期通过改变上下文进行数据增强的努力依赖于基于规则的方法，导致生成的上下文缺乏多样性和连贯性。为了解决这些问题，我们提出了一种面向前提的数据增强（PODA）框架。该框架可以生成包含正确和错误选项分析的CoT推理，同时从错误候选选项中构建多样且高质量的反事实上下文。我们将总结前提和识别每个选项的前提整合到推理中。随后，我们使用多步提示与识别的前提来构建反事实上下文。为了增强模型更好地区分每个选项相关的推理过程的能力，我们引入了一种新的思路路径对比学习方法，比较原始样本和反事实样本之间的推理路径。三个代表性的大型语言模型的实验结果表明，我们的方法可以在两个具有挑战性的逻辑推理基准（ReClor和LogiQA 2.0）上显著提升基线性能。数据和代码发布在https://github.com/lalalamdbf/TPReasoner。