摘要
从时间序列数据中查询因果效应在医疗保健、经济学、气候科学和流行病学等各个领域都非常重要。然而,在存在随时间变化的潜在混杂因素的情况下,这项任务变得复杂起来,这些混杂因素会随着时间推移影响治疗变量和结果变量,并可能在因果效应估计中引入偏差。传统的工具变量 (IV) 方法由于需要预定义的 IV 或在动态环境中不成立的强假设,在解决此类复杂性方面受到限制。为了解决这些问题,我们开发了一种用于去偏因果效应估计的新型随时间变化的条件工具变量 (CIV),称为 TDCIV。TDCIV 利用长短期记忆 (LSTM) 和变分自动编码器 (VAE) 模型,在没有先验知识的情况下,从代理变量中解开并学习随时间变化的 CIV 及其条件集的表示。在马尔可夫性质和代理变量可用性的假设下,我们从理论上证明了这些学习到的表示在解决随时间变化的潜在混杂因素引起的偏差方面的有效性,从而能够进行准确的因果效应估计。我们提出的 TDCIV 是第一个能够有效学习随时间变化的 CIV 及其相关条件集,而无需依赖领域特定知识的方法。