LLM2D
dcFCI:在潜在混杂因素、不忠实性和混合数据下的稳健因果发现
dcFCI: Robust Causal Discovery Under Latent Confounding, Unfaithfulness, and Mixed Data
作者: Ad\`ele H. Ribeiro, Dominik Heider
发布日期: 5/13/2025
arXiv ID: oai:arXiv.org:2505.06542v1

摘要

arXiv:2505.06542v1 交叉类型公告 摘要:因果发现是通过观察数据推断因果关系的核心。在存在潜在混杂变量的情况下,如快速因果推理(FCI)算法会学习一个部分祖先图(PAG),表示真实的模型的马尔可夫等价类。然而,它们的正确性高度依赖于经验忠实性的假设,即观察到的(不)独立性完美地反映了底层因果模型中的那些独立性,而在实践中,由于样本量有限,这一假设往往无法成立。为了解决这一问题,我们提出了第一个非参数评分方法,以评估PAG与观察到的数据的兼容性,即使在混合变量类型的情况下也是如此。这个评分方法既是必要条件也是充分条件,能够表征结构不确定性并区分不同的PAG。接着,我们提出了数据兼容FCI(dcFCI),这是第一个联合处理潜在混杂变量、经验不忠实性和混合数据类型的混合因果发现算法。dcFCI将我们的评分方法融入了一个由(任何时间)FCI引导的搜索过程,该过程系统地探索、排名和验证候选的PAG。在合成数据和实际场景的实验中,dcFCI在性能上显著优于现有最先进的方法,甚至在小型和异质数据集下也能恢复真正的PAG。进一步分析排名靠前的PAG为结构不确定性提供了有价值的见解,支持更为稳健和明智的因果推理和决策。