摘要
arXiv:2409.17174v3 宣告类型: replace-cross
摘要:基于链的推理方法,如思考链(CoT)在解决大型语言模型(LLMs)的推理任务中发挥着越来越重要的作用。然而,在推理步骤与其对应的状态转换之间产生的因果幻觉已成为推进LLMs推理能力的重要障碍,尤其是在长距离推理任务中。本文提出了一种非基于链的推理框架,同时考虑因果重要性和一致性,即因果重要性和一致性增强器(CSCE)。我们通过使用疗效评估定制LLM的损失函数,从因果重要性和一致性两个方面增强其推理能力。这确保了模型捕捉到关键的因果关系,并在各种场景下保持稳健和一致的性能。此外,我们将推理过程从像CoT等链基方法中常用的级联多步骤推理,转变为一个因果增强的方法,一次性输出整个推理过程,进一步提高了模型的推理效率。广泛的实验证明,我们的方法在推理成功率和速度上都有所改进。这些改进进一步表明,非基于链的方法也可以帮助LLMs完成推理任务。