LLM2D

摘要

arXiv:2502.06289v1 宣告类型: 交叉摘要：基础模型（FMs）的兴起正在改变医疗领域。在眼科领域，RETFound，一种专门为视网膜训练的FM，通过顺序预训练在140万自然图像和160万视网膜图像上，展示了在临床应用中的高度适应性。相反，一种通用视觉FM DINOv2在1.42亿自然图像上预训练后，在非医疗领域显示出了潜力。然而，其在临床任务中的应用尚未得到充分探索。为了解决这一问题，我们通过调整RETFound和三个DINOv2模型（大、基、小）的微调，对三种用于眼病检测和全身疾病预测的任务进行了头对头评估，涵盖了八个标准化开源眼病数据集，以及Moorfields AlzEye和UK Biobank数据集。在糖尿病视网膜病变的检测中，DINOv2-Large模型优于RETFound（三个数据集中的AUROC分别为0.850-0.952 vs 0.823-0.944，所有P≤0.007），在多类眼病的检测中，DINOv2-Large模型的AUROC为0.892，而RETFound的AUROC为0.846（P<0.001）。在青光眼中，DINOv2-BASE模型优于RETFound（AUROC分别为0.958 vs 0.940，P<0.001）。相反，RETFound在预测心力衰竭、心肌梗死和缺血性中风方面均优于所有DINOv2模型（AUROC分别为0.732-0.796 vs 0.663-0.771，所有P<0.001）。即使在只有10%的微调数据的情况下，这种趋势也持续存在。这些发现展示了通用和领域特定的FM在不同场景下的优势，突显了根据任务特定要求选择FM以优化临床性能的重要性。