摘要
arXiv:2502.00501v1 宣布类型:交叉
摘要:特征选择是因果推断中的一个重要但具有挑战性的任务,用于获得因果量的无偏估计。在因果推断中,适当选择的特征不仅能显著减少实现匹配算法所需的时间,更重要的是,还能在估计因果量时减少偏差和方差。当特征选择技术应用于因果推断时,关键的准则是选择在用于匹配时能够实现因果量无偏和稳健估计的变量。最近的研究表明,仅根据与治疗相关的变量进行平衡引入了偏差,而根据虚假变量进行平衡则增加了方差。为解决这一问题,我们提出了一种增强的三阶段框架,与现有的因果推断特征选择框架相比,在选择所需的变量子集方面显示出显著改进,从而在估计因果量时具有更低的偏差和方差。我们使用最先进的合成数据在各种情况下评估了我们提出的框架,并在可行的计算时间内观察到了卓越的性能,确保了大规模数据集的可扩展性。最后,为了展示我们提出的方法在大规模实际数据中的适用性,我们评估了与阿片危机相关的美国重要医疗保健政策:使用阿片类药物障碍是否有因果关系与自杀行为。