LLM2D

摘要

基于链的推理方法，如思维链 (CoT)，在解决大型语言模型 (LLMs) 的推理任务中扮演着越来越重要的角色。然而，**推理步骤**与**相应状态转换**之间的因果幻觉正成为提升 LLMs 推理能力，尤其是长距离推理任务能力的重大障碍。本文提出了一种非基于链的推理框架，用于同时考虑因果显著性和一致性，即因果显著性和一致性增强器 (CSCE)。我们利用治疗效果评估定制 LLMs 的损失函数，从两个方面增强其推理能力：因果显著性和一致性。这确保了模型能够捕捉到重要的因果关系，并在各种情况下保持稳健且一致的性能。此外，我们将推理过程从基于链方法（如 CoT）中常用的级联式多步推理转变为一种因果增强方法，该方法可以一次性输出整个推理过程，进一步提高模型的推理效率。大量的实验表明，我们的方法提高了推理成功率和速度。这些改进进一步表明，非基于链的方法也可以帮助 LLMs 完成推理任务。