LLM2D
AIPatient:利用电子健康记录和大型语言模型驱动的代理工作流模拟患者
AIPatient: Simulating Patients with EHRs and LLM Powered Agentic Workflow
作者: Huizi Yu, Jiayan Zhou, Lingyao Li, Shan Chen, Jack Gallifant, Anye Shi, Xiang Li, Wenyue Hua, Mingyu Jin, Guang Chen, Yang Zhou, Zhao Li, Trisha Gupte, Ming-Li Chen, Zahra Azizi, Yongfeng Zhang, Themistocles L. Assimes, Xin Ma, Danielle S. Bitterman, Lin Lu, Lizhou Fan
发布日期: 9/30/2024
arXiv ID: oai:arXiv.org:2409.18924v1

摘要

模拟病人系统在现代医学教育和研究中发挥着至关重要的作用,它们提供安全、综合的学习环境,并能够模拟临床决策。大型语言模型 (LLM) 可以通过高保真度和低成本地复制医疗状况和患者-医生互动来推进模拟病人系统。然而,确保这些系统的有效性和可信度仍然是一个挑战,因为它们需要一个庞大、多样化且精确的患者知识库,以及一个强大且稳定的知识传播机制。在这里,我们开发了 AIPatient,这是一种先进的模拟病人系统,它以 AIPatient 知识图谱 (AIPatient KG) 作为输入,并以推理检索增强生成 (Reasoning RAG) 代理工作流作为生成主干。AIPatient KG 从医疗信息密集护理 (MIMIC)-III 数据库中的电子健康记录 (EHR) 中采样数据,产生了一个临床多样化且相关的 1,495 名患者队列,具有很高的知识库有效性 (F1 0.89)。推理 RAG 利用六个 LLM 驱动的代理,涵盖检索、KG 查询生成、抽象、检查器、重写和摘要等任务。这种代理框架在基于 EHR 的医疗问答 (QA) 中的整体准确率达到 94.15%,优于不使用任何代理或仅部分集成代理的基准。我们的系统还具有很高的可读性(中位数弗莱士可读性指数为 77.23;中位数弗莱士-金凯德等级为 5.6)、鲁棒性(方差分析 F 值为 0.6126,p<0.1)和稳定性(方差分析 F 值为 0.782,p<0.1)。AIPatient 系统的良好性能突出了其在支持广泛应用方面的潜力,包括医学教育、模型评估和系统集成。