LLM2D
将大型语言模型集成到因果发现中:一种统计因果方法
Integrating Large Language Models in Causal Discovery: A Statistical Causal Approach
作者: Masayuki Takayama, Tadahisa Okuda, Thong Pham, Tatsuyoshi Ikenoue, Shingo Fukuma, Shohei Shimizu, Akiyoshi Sannai
发布日期: 2/4/2025
arXiv ID: oai:arXiv.org:2402.01454v4

摘要

arXiv:2402.01454v4 宣布类型: replace-cross 摘要:在实际的统计因果发现(SCD)中,将领域专家知识作为约束嵌入到算法中对于创建一致性和有意义的因果模型非常重要,尽管系统获取背景知识的挑战很大。为克服这些挑战,本文提出了一种新方法,通过“统计因果提示(SCP)”将SCD与大型语言模型(LLM)的知识为基础的因果推理(KBCI)相结合,以及在SCD中添加LLM-KBCI先验知识增强。实验结果表明,LLM-KBCI和结合LLM-KBCI的SCD增强的结果更接近于地面真相,而没有先验知识的SCD结果则不尽如此。还发现,如果LLM经历了SCP,SCD结果可以进一步改进。此外,我们通过一个未公开的真实世界数据集,证明了LLM提供的背景知识可以改善这个数据集的SCD,即使这个数据集从未包含在LLM的训练数据中。对于未来在诸如医疗保健等关键领域实用化这一提出的方法,本文详细讨论了限制、重大错误的风险、LLM技术改进的预期以及结果专家检查的现实集成,包括各种成功和失败场景下的SCP模拟。这种工作中的建议方法的仔细和适当的运用,通过每个领域的改进和定制化,可以解决数据集偏差和限制等挑战,展示了LLM在跨多种科学领域改善数据驱动因果推理的潜力。本文中所使用的所有代码均可在以下网址获取:www.github.com/mas-takayama/LLM-and-SCD