摘要
开发用于胸部X光片(CXR)分析报告生成的具有可解释性的系统,对于计算机辅助诊断(CAD)系统而言日益重要,这使得放射科医生能够理解这些系统做出的决策。尽管专注于报告生成的各种数据集和方法不断涌现,但在这些模型生成的报告与真实放射科医生的解读之间的一致性方面,仍然存在显著差距。在本研究中,我们首先介绍了细粒度CXR (FG-CXR)数据集,该数据集提供了放射科医生生成的标题与每个解剖结构对应的注视热力图之间的细粒度配对信息。与现有数据集(包含原始注视序列和报告,注视位置和报告内容之间存在显著错位)不同,我们的FG-CXR数据集提供了注视注意力和诊断记录之间更细粒度的一致性。此外,我们的分析表明,简单地应用黑盒图像字幕方法来生成报告并不能充分解释CXR中使用了哪些信息以及需要多长时间的注意力才能准确生成报告。因此,我们提出了一种新颖的可解释放射科医生注意力生成网络(Gen-XAI),该网络模拟放射科医生的诊断过程,明确地约束其输出与放射科医生的注视注意力和记录紧密一致。最后,我们进行了大量的实验来证明我们方法的有效性。我们的数据集和检查点可在https://github.com/UARK-AICV/FG-CXR获取。