摘要
arXiv:2412.14019v2 公告类型: 修订
摘要: 因果发现对于理解复杂系统至关重要,因为它旨在从观察数据(通常以因果有向无环图(DAG)的形式)中揭示因果关系。然而,传统方法往往依赖于一些强且无法验证的假设,这使其在实际应用中不可靠。大型语言模型(LLMs)提供了一种有潜力的替代方法,可以从基于文本的元数据中提取因果知识,整合领域专业知识。然而,LLMs 容易出现不可靠性和幻觉,需要采用策略来克服其局限性。一种这样的策略是利用一致性度量来评估可靠性。此外,大多数文本元数据没有清晰地区分直接因果关系与间接因果关系,进一步增加了发现因果 DAG 的复杂性。因此,专注于因果顺序而非因果 DAG 作为一种更实用和稳健的方法出现了。我们提出了一种新方法,用于从 LLM 获取的一致性分数中推导出一组有向无环图(表示合理的因果顺序)。我们的方法首先计算变量之间的成对一致性分数,生成一个半完备的有向图来聚合这些分数。从这种结构中,我们确定了最优的有向无环图,优先选择那些在所有配置中最大化一致性的方案。我们在多个公认的基准测试以及来自流行病学和公共卫生的实际数据集上测试了我们的方法。我们的结果证明了我们的方法在恢复因果顺序类方面的有效性。