摘要
基于链的推理方法,如思维链 (CoT),在解决大型语言模型 (LLMs) 的推理任务中扮演着越来越重要的角色。然而,**推理步骤**与**相应状态转换**之间的因果幻觉正成为提升 LLMs 推理能力,尤其是长距离推理任务能力的重大障碍。本文提出了一种非基于链的推理框架,用于同时考虑因果显著性和一致性,即因果显著性和一致性增强器 (CSCE)。我们利用治疗效果评估定制 LLMs 的损失函数,从两个方面增强其推理能力:因果显著性和一致性。这确保了模型能够捕捉到重要的因果关系,并在各种情况下保持稳健且一致的性能。此外,我们将推理过程从基于链方法(如 CoT)中常用的级联式多步推理转变为一种因果增强方法,该方法可以一次性输出整个推理过程,进一步提高模型的推理效率。大量的实验表明,我们的方法提高了推理成功率和速度。这些改进进一步表明,非基于链的方法也可以帮助 LLMs 完成推理任务。