LLM2D
使用Swin Transformer和移位窗注意力增强DR分类
Enhancing DR Classification with Swin Transformer and Shifted Window Attention
作者: Meher Boulaabi, Takwa Ben A\"icha Gader, Afef Kacem Echi, Zied Bouraoui
发布日期: 4/23/2025
arXiv ID: oai:arXiv.org:2504.15317v1

摘要

arXiv:2504.15317v1 Announce Type: cross 摘要:糖尿病视网膜病变(DR)是全球范围内导致失明的主要原因之一,强调了早期检测对于有效治疗的重要性。然而,由于图像质量的差异、类别不平衡以及像素级别的相似性导致的模型训练困难,自动化DR分类仍然具有挑战性。为应对这些问题,我们提出了一种稳健的预处理流水线,结合了图像裁剪、限制定量自适应直方图均衡化(CLAHE)以及目标化数据增强,以提高模型的泛化能力和鲁棒性。我们的方法利用了Swin Transformer,该模型采用分层标记处理和移位窗口注意力机制,可以在保持线性计算复杂度的同时高效地捕捉细微特征。我们在Aptos和IDRiD数据集上对多类DR分类进行了验证,分别达到了89.65%和97.40%的准确率。这些结果表明了我们模型的有效性,尤其是在早期阶段的DR检测方面,突显了其在临床环境中改善自动化视网膜筛查的潜力。