LLM2D

摘要

arXiv:2504.16448v1 类别：交叉摘要：医疗咨询对话包含关键的临床信息，但由于其非结构化的性质，在诊断和治疗中的有效利用受到阻碍。传统的方法依赖于基于规则或浅层机器学习技术，难以捕捉深层次和隐含的语义。最近，大型预训练语言模型和基于低秩适应（LoRA）的轻量级微调方法显示出结构化信息提取的潜力。我们提出了EMRModel，这是一种新颖的方法，将基于LoRA的微调与代码风格的提示设计相结合，旨在高效地将医疗咨询对话转换为结构化的电子医疗记录（EMRs）。此外，我们构建了一个高质量、实际落地的数据集，该数据集包含详细的注释，医疗咨询对话。我们还引入了医疗咨询信息提取的细粒度评估基准，并提供了一种系统评估方法，从而推动了医疗自然语言处理（NLP）模型的优化。实验结果表明，EMRModel 的F1分数达到了88.1%，相比标准预训练模型提高了49.5%。与传统的LoRA微调方法相比，我们的模型显示出了更好的性能，突显了其在结构化医疗记录提取任务中的有效性。