摘要
arXiv:2410.16676v4 宣告类型: 修改
摘要:因果推理(CR)是智能的关键方面,对于问题解决、决策制定和理解世界至关重要。虽然语言模型(LMs)可以为它们的输出生成解释,但它们可靠地执行因果推理的能力仍然不确定,往往在需要深刻理解因果性的任务中表现不佳。在这篇论文中,我们介绍了CausalEval,这是旨在提高LMs进行因果推理的研究全面综述,同时附带了对当前模型和方法的实证评估。我们根据LMs的作用对其现有方法进行了分类:要么作为推理引擎,要么作为提供知识或数据以辅助传统因果推理方法的帮助者,随后对每个类别中的方法学进行了详细讨论。然后,我们评估了当前LMs和各种增强方法在一系列因果推理任务中的性能,提供了关键发现和深入分析。最后,我们展示了当前研究的见解,并指出了未来研究的有希望的方向。我们希望这项工作能够成为全面的资源,促进进一步在LMs中进行因果推理的进展。