LLM2D

摘要

arXiv:2410.19955v2 通知类型: replace-cross 摘要：尽管电子健康记录（EHR）在AI辅助诊断预测中的使用日益增多，但大多数数据驱动的模型在整合临床相关医学知识方面存在困难。它们通常依赖于有限的本体，缺乏结构化的推理能力和全面的覆盖范围。这引发了一个重要的研究问题：医学知识能否改善预测模型，以支持人类医生进行的逐步临床推理？为了解决这一问题，我们提出了一种双重专业知识框架DuaLK，该框架结合了两种互补的信息来源。对于外部知识，我们构建了一个诊断知识图谱（KG），该图谱通过大型语言模型（LLM）编码了丰富的层级和语义关系。为了与患者数据对齐，我们进一步引入了一个基于实验室测试信号的代理任务，该任务指导模型遵循基于实验室测试信号的临床一致、逐步的推理过程。在两个公开的EHR数据集上的实验结果表明，DuaLK在四种临床预测任务中始终优于现有基线。这些发现突显了结合结构化医学知识与个体层面的临床信号以实现更准确和可解释性诊断预测的潜力。源代码可在https://github.com/humphreyhuu/DuaLK上公开获取。