LLM2D
读取你的心:通过预训练心电图语言模型学习心电信号单词和句法
Reading Your Heart: Learning ECG Words and Sentences via Pre-training ECG Language Model
作者: Jiarui Jin, Haoyu Wang, Hongyan Li, Jun Li, Jiahui Pan, Shenda Hong
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2502.10707v1

摘要

arXiv:2502.10707v1 宣布类型:交叉学科 摘要:心电图(ECG)对于临床诊断心律失常和其他心脏疾病至关重要,但由于基于ECG的深度学习方法往往需要高质量的标注,因此常常会受到限制。尽管之前的心电图自我监督学习(eSSL)方法已经在无标注ECG数据的表示学习上取得了显著进步,但它们通常将ECG信号视为普通的时序数据,并使用固定大小和固定步长的时间窗口对其进行分割,这往往忽略了ECG信号的形式、节奏特征以及潜在的语义关系。在这项工作中,我们引入了对ECG信号的新视角,将心跳视为单词,将节奏视为句子。基于这种视角,我们首先设计了QRS-Tokenize模块,该模块从原始ECG信号中生成语义有意义的ECG句子。在此基础上,我们提出了HeartLang,这是一种新的ECG语言处理的自我监督学习框架,用于在形式和节奏层次上学习通用表示。此外,我们构建了迄今为止最大的基于心跳的ECG词汇表,这将进一步推动ECG语言处理的发展。我们在六个多公开的ECG数据集上评估了HeartLang,结果显示它在与其他eSSL方法的竞争中表现出强大的竞争力。我们的数据和代码已在https://github.com/PKUDigitalHealth/HeartLang 公开提供。