LLM2D

摘要

arXiv:2410.16676v4 宣告类型: 修改摘要：因果推理（CR）是智能的关键方面，对于问题解决、决策制定和理解世界至关重要。虽然语言模型（LMs）可以为它们的输出生成解释，但它们可靠地执行因果推理的能力仍然不确定，往往在需要深刻理解因果性的任务中表现不佳。在这篇论文中，我们介绍了CausalEval，这是旨在提高LMs进行因果推理的研究全面综述，同时附带了对当前模型和方法的实证评估。我们根据LMs的作用对其现有方法进行了分类：要么作为推理引擎，要么作为提供知识或数据以辅助传统因果推理方法的帮助者，随后对每个类别中的方法学进行了详细讨论。然后，我们评估了当前LMs和各种增强方法在一系列因果推理任务中的性能，提供了关键发现和深入分析。最后，我们展示了当前研究的见解，并指出了未来研究的有希望的方向。我们希望这项工作能够成为全面的资源，促进进一步在LMs中进行因果推理的进展。