LLM2D

摘要

arXiv:2501.18670v1 类型：交叉摘要：心电图（ECG）解读是心脏诊断的核心。本文探讨了一种实用的方法，通过使用多模态LLaMA 3.2模型来增强ECG图像的解读。我们使用了一种参数高效调优策略，即低秩适应（LoRA），专门设计用于提高模型理解ECG图像的能力，并在广泛的心脏疾病情况下取得更好的结果。我们的方法针对ECG分析进行了定制，并利用了一个包含100万个样本的大型指令数据集ECGInstruct。这个数据集是一个由从如MIMIC-IV ECG和PTB-XL等可信赖的开源存储库生成的原始ECG数据合成而成的丰富ECG图像集合。ECGInstruct中的每个ECG图像都配备了由专家编写的问题和详细的答案，涵盖了多种多样的ECG解读场景，包括心肌梗死和传导障碍等复杂心脏状况。我们的调优方法通过结合低秩适应技术高效地适应了基于LLaMA 3构建的LLaMA 3.2模型，特别关注效率，仅更新一小部分参数，而不更新`lm_head`和`embed_tokens`层。本文详细介绍了模型设置、高效调优方法以及实施细节。我们通过广泛的实验进行了全面的评估，表明我们的方法在各种ECG解读任务中表现出色。结果表明，我们的参数高效LoRA调优在ECG图像解读中取得了卓越的性能，显著优于基线模型，并在识别广泛心脏异常方面达到或超过了传统的基于CNN的方法的准确性，包括PTB-XL数据集中超过70种条件的识别。