LLM2D
面向医疗时间序列的知识增强条件插补
Knowledge Enhanced Conditional Imputation for Healthcare Time-series
作者: Linglong Qian, Joseph Arul Raj, Hugh Logan Ellis, Ao Zhang, Yuezhou Zhang, Tao Wang, Richard JB Dobson, Zina Ibrahim
发布日期: 10/1/2024
arXiv ID: oai:arXiv.org:2312.16713v3

摘要

我们提出了一种端到端的架构,用于管理从医院电子健康记录 (EHR) 中提取的多元时间序列中的复杂缺失值。我们的条件自注意力插补 (CSAI) 是一种循环神经网络架构,配备了许多技术,旨在通过使模型与临床数据典型的微妙时间和空间依赖关系相一致来提高插补精度。CSAI a) 利用基于注意力的隐藏状态初始化来捕获时间序列中的长距离和短距离相关性,b) 整合了知识嵌入技术来捕获临床数据记录模式,c) 采用非均匀掩蔽策略来适应其权重以适应数据的时间和横截面缺失模式。对三个 EHR 基准数据集的广泛评估表明,除了在下游任务中的性能外,CSAI 还增强了数据恢复方面的最新技术功效。此外,CSAI 集成在 PyPOTS Python 库中用于基准测试,为研究人员提供了开放的标准化基准测试功能和易用性。