LLM2D
基于超大规模自然图像的基礎模型是否优于专用于视网膜的模型以检测眼部和全身疾病?
Is an Ultra Large Natural Image-Based Foundation Model Superior to a Retina-Specific Model for Detecting Ocular and Systemic Diseases?
作者: Qingshan Hou, Yukun Zhou, Jocelyn Hui Lin Goh, Ke Zou, Samantha Min Er Yew, Sahana Srinivasan, Meng Wang, Thaddaeus Lo, Xiaofeng Lei, Siegfried K. Wagner, Mark A. Chia, Dawei Yang, Hongyang Jiang, AnRan Ran, Rui Santos, Gabor Mark Somfai, Juan Helen Zhou, Haoyu Chen, Qingyu Chen, Carol Yim-Lui Cheung, Pearse A. Keane, Yih Chung Tham
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2502.06289v1

摘要

arXiv:2502.06289v1 宣告类型: 交叉 摘要:基础模型(FMs)的兴起正在改变医疗领域。在眼科领域,RETFound,一种专门为视网膜训练的FM,通过顺序预训练在140万自然图像和160万视网膜图像上,展示了在临床应用中的高度适应性。相反,一种通用视觉FM DINOv2在1.42亿自然图像上预训练后,在非医疗领域显示出了潜力。然而,其在临床任务中的应用尚未得到充分探索。为了解决这一问题,我们通过调整RETFound和三个DINOv2模型(大、基、小)的微调,对三种用于眼病检测和全身疾病预测的任务进行了头对头评估,涵盖了八个标准化开源眼病数据集,以及Moorfields AlzEye和UK Biobank数据集。在糖尿病视网膜病变的检测中,DINOv2-Large模型优于RETFound(三个数据集中的AUROC分别为0.850-0.952 vs 0.823-0.944,所有P≤0.007),在多类眼病的检测中,DINOv2-Large模型的AUROC为0.892,而RETFound的AUROC为0.846(P<0.001)。在青光眼中,DINOv2-BASE模型优于RETFound(AUROC分别为0.958 vs 0.940,P<0.001)。相反,RETFound在预测心力衰竭、心肌梗死和缺血性中风方面均优于所有DINOv2模型(AUROC分别为0.732-0.796 vs 0.663-0.771,所有P<0.001)。即使在只有10%的微调数据的情况下,这种趋势也持续存在。这些发现展示了通用和领域特定的FM在不同场景下的优势,突显了根据任务特定要求选择FM以优化临床性能的重要性。