LLM2D

摘要

arXiv:2504.00053v1 类型: cross 摘要: 目的：电子健康记录（EHR）广泛用于补充基于行政数据的疾病监测和医疗服务绩效评估。从EHR中定义疾病条件耗时且需要大量的手动标注疾病结果。本研究开发了一种基于先进大语言模型的有效策略，用于从EHR临床笔记中识别多个条件。方法：我们在2015年将加拿大艾伯塔省的一个心脏注册队列与EHR系统进行了链接。我们开发了一条生产线，利用生成性大语言模型（LLM）通过基于特定诊断、治疗管理以及临床指南的提示来分析、理解和解释EHR笔记。该生产线被应用于检测急性心肌梗死（AMI）、糖尿病和高血压。性能与临床验证诊断作为参考标准进行了比较，并与广泛采用的国际疾病分类（ICD）编码方法进行了比较。结果：研究队列包括3,088名患者和551,095份临床笔记。AMI、糖尿病和高血压的患病率分别为55.4%、27.7%和65.9%。基于LLM的生产线在检测条件方面的性能不同：AMI的敏感性为88%，特异性为63%，阳性预测值（PPV）为77%；糖尿病的敏感性为91%，特异性为86%，PPV为71%；高血压的敏感性为94%，特异性为32%，PPV为72%。与ICD编码相比，基于LLM的方法在所有条件下显示出改善的敏感性和阴性预测值。通过基于LLM和参考标准检测的病例的月度百分比趋势显示一致的模式。