LLM2D

摘要

arXiv:2504.00993v2 公告类型: 交叉替换摘要：医疗任务，如诊断和治疗规划，需要精确且复杂推理，特别是在关键生命领域尤为如此。与数学推理不同，医疗推理要求仔细且可验证的思考过程以确保可靠性和准确性。然而，缺乏能够提供透明且逐步推理以验证和增强AI模型医疗推理能力的数据集。为此，我们介绍了MedReason，这是一个大型高质量的医疗推理数据集，旨在让大规模语言模型（LLMs）能够实现准确且可解释的医疗问题解决。我们利用结构化的医学知识图谱（KG）将临床问答对转换为逻辑推理链，即“思维路径”，这些路径通过相关KG实体追踪问题要素到答案之间的联系。每条路径都会经过临床逻辑和证据医学的一致性验证。我们的管道从7个医疗数据集中生成了针对各种医疗问题的详细推理，最终形成包含32,682个问答对的大规模数据集，每个问答对都有详细的逐步解释。实验表明，使用我们的数据集进行微调可以持续提升医疗问题解决能力，DeepSeek-Ditill-8B的改进幅度达到了7.7%。我们表现最好的模型MedReason-8B在临床基准测试MedBullets中比最先进的医疗推理模型Huatuo-o1-8B的表现高出4.2%。我们还邀请了来自不同专科的医疗专业人士评估数据集的质量，确保MedReason提供准确且连贯的医疗推理。我们的数据、模型和代码可在https://github.com/UCSC-VLAA/MedReason 获取。