LLM2D

摘要

arXiv:2503.13309v2 Announce Type: replace-cross 摘要：尽管在计算机辅助诊断(CAD)系统方面取得了进展，乳腺癌仍然是全球女性癌症相关死亡的主要原因之一。近年来，人工智能(AI)在通过乳腺X线摄影进行乳腺癌诊断的先进深度学习(DL)架构开发方面展示了显著的前景。在此背景下，论文侧重于将AI集成到以人为中心的工作流程中，以增强乳腺癌诊断。然而，仍存在一些关键挑战，如依赖详细的肿瘤注释以及在测试过程中容易遗漏视图。为了解决这些问题，我们提出了一个混合、多尺度和多视角Swin Transformer基框架（MSMV-Swin），以增强诊断的稳健性和准确性。提出的MSMV-Swin框架旨在充当决策支持工具，帮助放射科医生更有效地分析多视角乳腺X线摄影图像。更具体地说，MSMV-Swin框架利用Segment Anything Model (SAM)来隔离乳腺叶，减少背景噪声，并实现全面的特征提取。提出的MSMV-Swin框架的多尺度性质不仅考虑了肿瘤特异性区域，还考虑了包围肿瘤的组织的空间特征，捕捉到局部和上下文信息。通过整合上下文和局部数据，MSMV-Swin的输出与放射科医生解读乳腺X线摄影图像的方式保持一致，促进了更好的人机交互和信任。然后设计了一个混合融合结构，以确保在临床实践中只有单个乳腺X线摄影视图可用时，能够抵抗视图缺失的侵袭性。