LLM2D

摘要

arXiv:2412.17041v2 自监督学习类别: replace-cross 摘要：3D 医学图像的自监督学习（SSL）领域缺乏一致性与标准化。尽管已经开发了许多方法，但由于 i) 变化且规模较小的预训练数据集，ii) 变化的架构，以及 iii) 不同的下游数据集进行评估等原因，无法确定当前最先进水平。在本文中，我们通过三个关键贡献为这一领域带来了清晰度，并为未来的方法进步奠定了基础：我们 a) 发布了迄今为止最大的公开可用的预训练数据集，包含 114,000 个 3D 脑部 MRI 体积，使所有从业者能够基于大规模数据集进行预训练。我们 b) 在这个数据集上对现有的 3D 自监督学习方法进行了基准测试，针对最先进的 CNN 和 Transformer 架构，澄清了 3D SSL 预训练的状态。在许多发现中，我们展示了预训练方法可以超过从零开始的 nnU-Net ResEnc-L 基准。最后，我们 c) 发布了我们的预训练和微调框架的代码，并提供了基准测试过程中创建的预训练模型，以促进快速采用和重现。