LLM2D

摘要

arXiv:2504.18049v1 Announce Type: cross 摘要：在医学图像领域，深度学习的兴起，尤其是卷积神经网络（CNNs）的应用，已经彻底改变了医学图像的分析和解读。然而，深度学习方法通常依赖大量的标注数据。在医学成像研究中，获取高质量的标注既昂贵又困难。视图变换器（ViT）和自我监督学习的引入提供了一种预训练策略，利用丰富的非标注数据，有效缓解了标注获取的挑战，同时也扩大了数据利用的广度。然而，ViT的高计算密度和对计算能力的大量需求，以及其在图像块上的操作缺乏定位特性，限制了其在许多应用场景中的效率和适用性。在这项研究中，我们采用轻量级CNN框架nn-MobileNet，实现了一种类似于BERT的自我监督学习方法。我们利用UK Biobank中未标注的眼底图像对网络进行预训练，以提高下游应用的性能。我们利用阿尔茨海默病（AD）、帕金森病（PD）以及多种眼底疾病识别任务验证了预训练模型的结果。结果显示，我们的方法可以显著提高下游任务的表现。总之，本研究表明，结合CNNs与高级自我监督学习的能力，在大量非标注数据的背景下处理数据的优势，展示了在标签稀缺情况下CNNs的潜力。