LLM2D
像放射学家一样推理:链式思考与强化学习在可验证报告生成中的应用
Reason Like a Radiologist: Chain-of-Thought and Reinforcement Learning for Verifiable Report Generation
作者: Peiyuan Jing, Kinhei Lee, Zhenxuan Zhang, Huichi Zhou, Zhengqing Yuan, Zhifan Gao, Lei Zhu, Giorgos Papanastasiou, Yingying Fang, Guang Yang
发布日期: 4/28/2025
arXiv ID: oai:arXiv.org:2504.18453v1

摘要

arXiv:2504.18453v1 宣告类型: 新 摘要: 影像学报告生成对于提高效率至关重要,但目前的模型缺乏专家的结构化推理能力,阻碍了临床的信任和可解释性,因为它们无法将视觉发现与精确的解剖位置链接起来。本文介绍了一种名为BoxMed-RL的开创性统一训练框架,旨在生成空间验证性和解释性的影像学报告。基于大型视觉-语言模型,BoxMed-RL通过两个集成的阶段革新了报告生成过程:(1)在预训练阶段,我们通过医学概念学习对模型进行优化,并使用思维链监督使模型内部化类似放射科医生的工作流程,然后进行空间验证强化,即将医疗发现与边界框对齐。 (2)在下游适配器阶段,我们冻结预训练权重并训练一个下游适配器,以确保流畅且临床可信的报告。该框架精确地模拟了放射科医生的工作流程,迫使模型将高层医学概念与明确的解剖证据联系起来。在公共数据集上的广泛实验表明,与最先进的方法相比,BoxMed-RL在METEOR和ROUGE-L指标上平均提高了7%。此外,基于大型语言模型的指标平均提高5%进一步证明了BoxMed-RL在生成高质量影像学报告方面的稳健性。