摘要
深度学习模型在计算病理学 (CPath) 任务中展现出巨大潜力,但由于领域偏移,它们在应用于未见数据时性能往往会下降。解决这个问题需要领域泛化 (DG) 算法。然而,目前缺乏对 CPath 环境中 DG 算法的系统评估。本研究旨在通过 7,560 次交叉验证运行,对 30 种 DG 算法在 3 个不同难度的 CPath 任务上的有效性进行基准测试。我们使用一个统一且稳健的平台评估这些算法,该平台整合了特定于模态的技术和最近的进展,例如预训练的基础模型。我们广泛的交叉验证实验提供了对各种 DG 策略的相对性能的见解。我们观察到自监督学习和染色增强始终优于其他方法,突出了预训练模型和数据增强的潜力。此外,我们引入了一个新的泛癌肿瘤检测数据集 (HISTOPANTUM) 作为未来研究的基准。本研究为研究人员选择适合 CPath 任务的 DG 方法提供了宝贵的指导。