LLM2D

摘要

逻辑阅读理解是一项具有挑战性的任务，它要求理解文本的潜在语义并应用推理来得出正确答案。先前的研究主要通过思维链（Chain-of-Thought, CoT）或数据增强来提升逻辑推理能力。然而，以往构建思维链理由的工作主要集中在分析正确选项上，忽略了错误选项。此外，早期通过改变上下文进行数据增强的努力依赖于基于规则的方法，导致生成的上下文缺乏多样性和连贯性。为了解决这些问题，我们提出了一种前提导向的数据增强（Premise-Oriented Data Augmentation, PODA）框架。该框架能够生成包含正确和错误选项分析的CoT理由，同时从错误候选选项中构建多样且高质量的反事实上下文。我们将总结前提和识别每个选项的前提纳入理由中。随后，我们使用识别出的前提进行多步提示，以构建反事实上下文。为了增强模型区分每个选项相关推理过程的能力，我们引入了一种新的思维路径对比学习方法，该方法比较原始样本和反事实样本之间的推理路径。在三个代表性的大型语言模型（LLMs）上的实验结果表明，我们的方法在两个具有挑战性的逻辑推理基准（ReClor和LogiQA 2.0）上显著提升了基线水平。数据和代码已在https://github.com/lalalamdbf/TPReasoner发布。