LLM2D
MedReason: 使用知识图谱引出LLM中的事实医疗推理步骤
MedReason: Eliciting Factual Medical Reasoning Steps in LLMs via Knowledge Graphs
作者: Juncheng Wu, Wenlong Deng, Xingxuan Li, Sheng Liu, Taomian Mi, Yifan Peng, Ziyang Xu, Yi Liu, Hyunjin Cho, Chang-In Choi, Yihan Cao, Hui Ren, Xiang Li, Xiaoxiao Li, Yuyin Zhou
发布日期: 4/8/2025
arXiv ID: oai:arXiv.org:2504.00993v2

摘要

arXiv:2504.00993v2 公告类型: 交叉替换 摘要:医疗任务,如诊断和治疗规划,需要精确且复杂推理,特别是在关键生命领域尤为如此。与数学推理不同,医疗推理要求仔细且可验证的思考过程以确保可靠性和准确性。然而,缺乏能够提供透明且逐步推理以验证和增强AI模型医疗推理能力的数据集。为此,我们介绍了MedReason,这是一个大型高质量的医疗推理数据集,旨在让大规模语言模型(LLMs)能够实现准确且可解释的医疗问题解决。我们利用结构化的医学知识图谱(KG)将临床问答对转换为逻辑推理链,即“思维路径”,这些路径通过相关KG实体追踪问题要素到答案之间的联系。每条路径都会经过临床逻辑和证据医学的一致性验证。我们的管道从7个医疗数据集中生成了针对各种医疗问题的详细推理,最终形成包含32,682个问答对的大规模数据集,每个问答对都有详细的逐步解释。实验表明,使用我们的数据集进行微调可以持续提升医疗问题解决能力,DeepSeek-Ditill-8B的改进幅度达到了7.7%。我们表现最好的模型MedReason-8B在临床基准测试MedBullets中比最先进的医疗推理模型Huatuo-o1-8B的表现高出4.2%。我们还邀请了来自不同专科的医疗专业人士评估数据集的质量,确保MedReason提供准确且连贯的医疗推理。我们的数据、模型和代码可在https://github.com/UCSC-VLAA/MedReason 获取。