摘要
从数据中检测和衡量混杂效应是因果推断中的一个关键挑战。现有的方法通常假设因果充分性,忽略了未观察到的混杂变量的存在。因果充分性既不现实又无法通过经验检验。此外,现有的方法对潜在的因果生成过程做出了强烈的参数假设,以保证混杂变量的可识别性。通过放宽因果充分性和参数假设,并利用因果发现和混杂分析在非独立同分布数据方面的最新进展,我们提出了一种检测和衡量混杂的综合方法。我们考虑了混杂的各种定义,并引入了量身定制的方法来实现三个目标:(i)检测和衡量一组变量之间的混杂;(ii)分离观察到的和未观察到的混杂效应;(iii)了解不同变量集之间混杂偏差的相对强度。我们展示了混杂度量的一些有用性质,并提出了满足这些性质的度量。实证结果支持理论分析。