LLM2D
一种用于识别眼底图像中疾病的BERT风格自我监督学习CNN
A BERT-Style Self-Supervised Learning CNN for Disease Identification from Retinal Images
作者: Xin Li, Wenhui Zhu, Peijie Qiu, Oana M. Dumitrascu, Amal Youssef, Yalin Wang
发布日期: 4/28/2025
arXiv ID: oai:arXiv.org:2504.18049v1

摘要

arXiv:2504.18049v1 Announce Type: cross 摘要:在医学图像领域,深度学习的兴起,尤其是卷积神经网络(CNNs)的应用,已经彻底改变了医学图像的分析和解读。然而,深度学习方法通常依赖大量的标注数据。在医学成像研究中,获取高质量的标注既昂贵又困难。视图变换器(ViT)和自我监督学习的引入提供了一种预训练策略,利用丰富的非标注数据,有效缓解了标注获取的挑战,同时也扩大了数据利用的广度。然而,ViT的高计算密度和对计算能力的大量需求,以及其在图像块上的操作缺乏定位特性,限制了其在许多应用场景中的效率和适用性。在这项研究中,我们采用轻量级CNN框架nn-MobileNet,实现了一种类似于BERT的自我监督学习方法。我们利用UK Biobank中未标注的眼底图像对网络进行预训练,以提高下游应用的性能。我们利用阿尔茨海默病(AD)、帕金森病(PD)以及多种眼底疾病识别任务验证了预训练模型的结果。结果显示,我们的方法可以显著提高下游任务的表现。总之,本研究表明,结合CNNs与高级自我监督学习的能力,在大量非标注数据的背景下处理数据的优势,展示了在标签稀缺情况下CNNs的潜力。