LLM2D

摘要

arXiv:2505.06542v1 交叉类型公告摘要：因果发现是通过观察数据推断因果关系的核心。在存在潜在混杂变量的情况下，如快速因果推理（FCI）算法会学习一个部分祖先图（PAG），表示真实的模型的马尔可夫等价类。然而，它们的正确性高度依赖于经验忠实性的假设，即观察到的（不）独立性完美地反映了底层因果模型中的那些独立性，而在实践中，由于样本量有限，这一假设往往无法成立。为了解决这一问题，我们提出了第一个非参数评分方法，以评估PAG与观察到的数据的兼容性，即使在混合变量类型的情况下也是如此。这个评分方法既是必要条件也是充分条件，能够表征结构不确定性并区分不同的PAG。接着，我们提出了数据兼容FCI（dcFCI），这是第一个联合处理潜在混杂变量、经验不忠实性和混合数据类型的混合因果发现算法。dcFCI将我们的评分方法融入了一个由（任何时间）FCI引导的搜索过程，该过程系统地探索、排名和验证候选的PAG。在合成数据和实际场景的实验中，dcFCI在性能上显著优于现有最先进的方法，甚至在小型和异质数据集下也能恢复真正的PAG。进一步分析排名靠前的PAG为结构不确定性提供了有价值的见解，支持更为稳健和明智的因果推理和决策。