摘要
医疗时间序列数据集的特点是存在缺失值,需要数据插补方法,然而,传统的机器学习模型由于缺乏对预测结果的不确定性量化而无法满足要求。在这些模型中,CATSI(上下文感知时间序列插补)因其在插补过程中融入上下文向量,捕捉每个患者的全局依赖关系而脱颖而出。本文提出了一种贝叶斯上下文感知时间序列插补(Bayes-CATSI)框架,该框架利用变分推断提供的 Uncertainty Quantification。我们考虑了来自脑电图 (EEG)、眼电图 (EOG)、肌电图 (EMG) 和心电图 (EKG) 的时间序列。变分推断假设后验分布的形状,并通过最小化 Kullback-Leibler (KL) 散度找到最接近真实后验分布的变分密度。因此,我们将变分贝叶斯深度学习层集成到 CATSI 模型中。我们的结果表明,Bayes-CATSI 不仅提供 Uncertainty Quantification,而且在插补性能方面也优于 CATSI 模型。具体来说,Bayes-CATSI 的一个实例比 CATSI 提高了 9.57%。我们提供了一个开源代码实现,用于将 Bayes-CATSI 应用于其他医疗数据插补问题。