摘要
arXiv:2504.00053v1 类型: cross
摘要: 目的:电子健康记录(EHR)广泛用于补充基于行政数据的疾病监测和医疗服务绩效评估。从EHR中定义疾病条件耗时且需要大量的手动标注疾病结果。本研究开发了一种基于先进大语言模型的有效策略,用于从EHR临床笔记中识别多个条件。方法:我们在2015年将加拿大艾伯塔省的一个心脏注册队列与EHR系统进行了链接。我们开发了一条生产线,利用生成性大语言模型(LLM)通过基于特定诊断、治疗管理以及临床指南的提示来分析、理解和解释EHR笔记。该生产线被应用于检测急性心肌梗死(AMI)、糖尿病和高血压。性能与临床验证诊断作为参考标准进行了比较,并与广泛采用的国际疾病分类(ICD)编码方法进行了比较。结果:研究队列包括3,088名患者和551,095份临床笔记。AMI、糖尿病和高血压的患病率分别为55.4%、27.7%和65.9%。基于LLM的生产线在检测条件方面的性能不同:AMI的敏感性为88%,特异性为63%,阳性预测值(PPV)为77%;糖尿病的敏感性为91%,特异性为86%,PPV为71%;高血压的敏感性为94%,特异性为32%,PPV为72%。与ICD编码相比,基于LLM的方法在所有条件下显示出改善的敏感性和阴性预测值。通过基于LLM和参考标准检测的病例的月度百分比趋势显示一致的模式。