摘要
arXiv:2502.06289v1 宣告类型: 交叉
摘要:基础模型(FMs)的兴起正在改变医疗领域。在眼科领域,RETFound,一种专门为视网膜训练的FM,通过顺序预训练在140万自然图像和160万视网膜图像上,展示了在临床应用中的高度适应性。相反,一种通用视觉FM DINOv2在1.42亿自然图像上预训练后,在非医疗领域显示出了潜力。然而,其在临床任务中的应用尚未得到充分探索。为了解决这一问题,我们通过调整RETFound和三个DINOv2模型(大、基、小)的微调,对三种用于眼病检测和全身疾病预测的任务进行了头对头评估,涵盖了八个标准化开源眼病数据集,以及Moorfields AlzEye和UK Biobank数据集。在糖尿病视网膜病变的检测中,DINOv2-Large模型优于RETFound(三个数据集中的AUROC分别为0.850-0.952 vs 0.823-0.944,所有P≤0.007),在多类眼病的检测中,DINOv2-Large模型的AUROC为0.892,而RETFound的AUROC为0.846(P<0.001)。在青光眼中,DINOv2-BASE模型优于RETFound(AUROC分别为0.958 vs 0.940,P<0.001)。相反,RETFound在预测心力衰竭、心肌梗死和缺血性中风方面均优于所有DINOv2模型(AUROC分别为0.732-0.796 vs 0.663-0.771,所有P<0.001)。即使在只有10%的微调数据的情况下,这种趋势也持续存在。这些发现展示了通用和领域特定的FM在不同场景下的优势,突显了根据任务特定要求选择FM以优化临床性能的重要性。