摘要
arXiv:2502.04413v1 类型:交叉学科
摘要:检索增强生成(RAG)是一种非常适合检索隐私敏感的电子健康记录(EHR)的技术。它可以作为医疗 copilot 的关键模块,帮助减少医护人员和患者误诊的风险。然而,现有基于启发式方法的 RAG 模型在医疗领域中的诊断准确性和特异性不足,特别是在相似临床表现的疾病诊断上。本文提出了一种名为 MedRAG 的 RAG 模型,该模型通过知识图谱(KG)引发的推理增强,依据临床表现检索诊断和治疗建议。MedRAG 有条不紊地构建了一个全面的四层级医疗诊断知识图谱,涵盖了各种疾病的关键诊断差异。这些差异动态地与从 EHR 数据库检索的相似 EHR 集成,并在大型语言模型中进行推理。这一过程使决策支持更加准确和具体,同时主动提供了后续问题以增强个性化的医疗决策。MedRAG 在公开数据集 DDXPlus 和来自淡马锡综合医院的私人慢性疼痛诊断数据集(CPDD)上进行了评估,并将其性能与各种现有的 RAG 方法进行了比较。实验结果显示,利用知识图谱的信息整合和关系能力,MedRAG 提供了更具针对性的诊断洞察,并在降低误诊率方面优于最新的模型。我们的代码将可在 https://github.com/SNOWTEAM2023/MedRAG 可用。