摘要
arXiv:2412.17041v2 自监督学习类别: replace-cross
摘要:3D 医学图像的自监督学习(SSL)领域缺乏一致性与标准化。尽管已经开发了许多方法,但由于 i) 变化且规模较小的预训练数据集,ii) 变化的架构,以及 iii) 不同的下游数据集进行评估等原因,无法确定当前最先进水平。在本文中,我们通过三个关键贡献为这一领域带来了清晰度,并为未来的方法进步奠定了基础:我们 a) 发布了迄今为止最大的公开可用的预训练数据集,包含 114,000 个 3D 脑部 MRI 体积,使所有从业者能够基于大规模数据集进行预训练。我们 b) 在这个数据集上对现有的 3D 自监督学习方法进行了基准测试,针对最先进的 CNN 和 Transformer 架构,澄清了 3D SSL 预训练的状态。在许多发现中,我们展示了预训练方法可以超过从零开始的 nnU-Net ResEnc-L 基准。最后,我们 c) 发布了我们的预训练和微调框架的代码,并提供了基准测试过程中创建的预训练模型,以促进快速采用和重现。