摘要
arXiv:2504.16448v1 类别:交叉
摘要:医疗咨询对话包含关键的临床信息,但由于其非结构化的性质,在诊断和治疗中的有效利用受到阻碍。传统的方法依赖于基于规则或浅层机器学习技术,难以捕捉深层次和隐含的语义。最近,大型预训练语言模型和基于低秩适应(LoRA)的轻量级微调方法显示出结构化信息提取的潜力。我们提出了EMRModel,这是一种新颖的方法,将基于LoRA的微调与代码风格的提示设计相结合,旨在高效地将医疗咨询对话转换为结构化的电子医疗记录(EMRs)。此外,我们构建了一个高质量、实际落地的数据集,该数据集包含详细的注释,医疗咨询对话。我们还引入了医疗咨询信息提取的细粒度评估基准,并提供了一种系统评估方法,从而推动了医疗自然语言处理(NLP)模型的优化。实验结果表明,EMRModel 的F1分数达到了88.1%,相比标准预训练模型提高了49.5%。与传统的LoRA微调方法相比,我们的模型显示出了更好的性能,突显了其在结构化医疗记录提取任务中的有效性。