摘要
随着大型语言模型 (LLM) 的兴起,理解它们在破译和解释语言所蕴含的复杂因果关系网络中的能力和局限性变得至关重要。当前的方法使用显式或隐式因果推理,但迫切需要一种将两者结合起来的方法,以更有效地处理各种因果关系。本研究提出了一种名为“具有反事实分析的上下文感知推理增强 (CARE CA)” 的新型架构,以增强因果推理和可解释性。该框架将显式因果检测模块与 ConceptNet 和反事实陈述相结合,以及通过 LLM 进行隐式因果检测。我们的框架更进一步,通过一层反事实解释来突出 LLM 对因果关系的理解。来自 ConceptNet 的知识增强了多种因果推理任务的性能,例如因果发现、因果识别和反事实推理。反事实句子增加了关于“非因果”场景的显式知识。通过结合这些强大的模块,我们的模型旨在提供对因果关系的更深入理解,从而实现增强的可解释性。对基准数据集的评估表明,所有指标(如准确率、精确率、召回率和 F1 分数)的性能均有所提高。我们还引入了 CausalNet,这是一个新的数据集,并附带我们的代码,以促进该领域进一步的研究。