LLM2D
基于多尺度多视图Swin Transformer框架的人本化AI集成乳腺癌诊断
Integrating AI for Human-Centric Breast Cancer Diagnostics: A Multi-Scale and Multi-View Swin Transformer Framework
作者: Farnoush Bayatmakou, Reza Taleei, Milad Amir Toutounchian, Arash Mohammadi
发布日期: 5/9/2025
arXiv ID: oai:arXiv.org:2503.13309v2

摘要

arXiv:2503.13309v2 Announce Type: replace-cross 摘要:尽管在计算机辅助诊断(CAD)系统方面取得了进展,乳腺癌仍然是全球女性癌症相关死亡的主要原因之一。近年来,人工智能(AI)在通过乳腺X线摄影进行乳腺癌诊断的先进深度学习(DL)架构开发方面展示了显著的前景。在此背景下,论文侧重于将AI集成到以人为中心的工作流程中,以增强乳腺癌诊断。然而,仍存在一些关键挑战,如依赖详细的肿瘤注释以及在测试过程中容易遗漏视图。为了解决这些问题,我们提出了一个混合、多尺度和多视角Swin Transformer基框架(MSMV-Swin),以增强诊断的稳健性和准确性。提出的MSMV-Swin框架旨在充当决策支持工具,帮助放射科医生更有效地分析多视角乳腺X线摄影图像。更具体地说,MSMV-Swin框架利用Segment Anything Model (SAM)来隔离乳腺叶,减少背景噪声,并实现全面的特征提取。提出的MSMV-Swin框架的多尺度性质不仅考虑了肿瘤特异性区域,还考虑了包围肿瘤的组织的空间特征,捕捉到局部和上下文信息。通过整合上下文和局部数据,MSMV-Swin的输出与放射科医生解读乳腺X线摄影图像的方式保持一致,促进了更好的人机交互和信任。然后设计了一个混合融合结构,以确保在临床实践中只有单个乳腺X线摄影视图可用时,能够抵抗视图缺失的侵袭性。