LLM2D
ECG-专家-QA:心血管疾病诊断大型语言模型评估基准
ECG-Expert-QA: A Benchmark for Evaluating Medical Large Language Models in Heart Disease Diagnosis
作者: Xu Wang, Jiaju Kang, Puyu Han, Yubao Zhao, Qian Liu, Liwenfei He, Lingqiong Zhang, Lingyun Dai, Yongcheng Wang, Jie Tao
发布日期: 4/8/2025
arXiv ID: oai:arXiv.org:2502.17475v3

摘要

arXiv:2502.17475v3 宣告类型: replace-cross 摘要:我们介绍了ECG-Expert-QA,这是一个全面的多模态数据集,用于评估心电图(ECG)解释中的诊断能力。该数据集结合了真实的临床上ECG数据和系统生成的合成病例,涵盖了12项基本诊断任务,共计47,211对专家验证的问答对。这些问答对涵盖了从基本节律识别到涉及罕见病症和时间变化的复杂诊断等各种临床场景。一个关键的创新是支持多回合对话,这使得可以开发出模拟临床医生-患者或跨专业互动的对话式医疗AI系统。这使得AI模型的临床推理、诊断准确性和知识整合的评估更加现实。通过一个知识引导的框架并严格执行质量控制,ECG-Expert-QA 确保了语言和临床一致性,使其成为促进辅助心电图解释的优质资源。该数据集挑战模型识别细微的心肌缺血变化并在富有情境的场景中解释复杂的心律失常。为促进研究透明度和合作,该数据集、配套代码和提示已公开发布在 https://github.com/Zaozzz/ECG-Expert-QA