摘要
arXiv:2501.18670v1 类型:交叉
摘要:心电图(ECG)解读是心脏诊断的核心。本文探讨了一种实用的方法,通过使用多模态LLaMA 3.2模型来增强ECG图像的解读。我们使用了一种参数高效调优策略,即低秩适应(LoRA),专门设计用于提高模型理解ECG图像的能力,并在广泛的 心脏疾病情况下取得更好的结果。我们的方法针对ECG分析进行了定制,并利用了一个包含100万个样本的大型指令数据集ECGInstruct。这个数据集是一个由从如MIMIC-IV ECG和PTB-XL等可信赖的开源存储库生成的原始ECG数据合成而成的丰富ECG图像集合。ECGInstruct中的每个ECG图像都配备了由专家编写的问题和详细的答案,涵盖了多种多样的ECG解读场景,包括心肌梗死和传导障碍等复杂心脏状况。我们的调优方法通过结合低秩适应技术高效地适应了基于LLaMA 3构建的LLaMA 3.2模型,特别关注效率,仅更新一小部分参数,而不更新`lm_head`和`embed_tokens`层。本文详细介绍了模型设置、高效调优方法以及实施细节。我们通过广泛的实验进行了全面的评估,表明我们的方法在各种ECG解读任务中表现出色。结果表明,我们的参数高效LoRA调优在ECG图像解读中取得了卓越的性能,显著优于基线模型,并在识别广泛心脏异常方面达到或超过了传统的基于CNN的方法的准确性,包括PTB-XL数据集中超过70种条件的识别。