LLM2D
EMRModel:一个用于提取医疗咨询对话的结构化医疗记录的大语言模型
EMRModel: A Large Language Model for Extracting Medical Consultation Dialogues into Structured Medical Records
作者: Shuguang Zhao, Qiangzhong Feng, Zhiyang He, Peipei Sun, Yingying Wang, Xiaodong Tao, Xiaoliang Lu, Mei Cheng, Xinyue Wu, Yanyan Wang, Wei Liang
发布日期: 4/24/2025
arXiv ID: oai:arXiv.org:2504.16448v1

摘要

arXiv:2504.16448v1 类别:交叉 摘要:医疗咨询对话包含关键的临床信息,但由于其非结构化的性质,在诊断和治疗中的有效利用受到阻碍。传统的方法依赖于基于规则或浅层机器学习技术,难以捕捉深层次和隐含的语义。最近,大型预训练语言模型和基于低秩适应(LoRA)的轻量级微调方法显示出结构化信息提取的潜力。我们提出了EMRModel,这是一种新颖的方法,将基于LoRA的微调与代码风格的提示设计相结合,旨在高效地将医疗咨询对话转换为结构化的电子医疗记录(EMRs)。此外,我们构建了一个高质量、实际落地的数据集,该数据集包含详细的注释,医疗咨询对话。我们还引入了医疗咨询信息提取的细粒度评估基准,并提供了一种系统评估方法,从而推动了医疗自然语言处理(NLP)模型的优化。实验结果表明,EMRModel 的F1分数达到了88.1%,相比标准预训练模型提高了49.5%。与传统的LoRA微调方法相比,我们的模型显示出了更好的性能,突显了其在结构化医疗记录提取任务中的有效性。