LLM2D

摘要

arXiv:2409.17174v3 宣告类型: replace-cross 摘要：基于链的推理方法，如思考链（CoT）在解决大型语言模型（LLMs）的推理任务中发挥着越来越重要的作用。然而，在推理步骤与其对应的状态转换之间产生的因果幻觉已成为推进LLMs推理能力的重要障碍，尤其是在长距离推理任务中。本文提出了一种非基于链的推理框架，同时考虑因果重要性和一致性，即因果重要性和一致性增强器（CSCE）。我们通过使用疗效评估定制LLM的损失函数，从因果重要性和一致性两个方面增强其推理能力。这确保了模型捕捉到关键的因果关系，并在各种场景下保持稳健和一致的性能。此外，我们将推理过程从像CoT等链基方法中常用的级联多步骤推理，转变为一个因果增强的方法，一次性输出整个推理过程，进一步提高了模型的推理效率。广泛的实验证明，我们的方法在推理成功率和速度上都有所改进。这些改进进一步表明，非基于链的方法也可以帮助LLMs完成推理任务。