摘要
arXiv:2505.01109v1 Announce Type: 全文
摘要: 多实例学习(MIL)已经成为全切片图像(WSI)分类的最佳解决方案。它包括将每张切片分为多个斑块,这些斑块被视为一个带有全局标签的实例集合。MIL 包含两种主要方法:实例基和嵌入基。在实例基方法中,每个斑块独立分类,然后汇总斑块评分以预测集合标签。而在嵌入基方法中,在汇总斑块嵌入后进行集合分类。尽管实例基方法自然更具可解释性,但在过去,嵌入基 MIL 由于其对差特征提取器的鲁棒性而常用。然而,最近,通过自我监督学习(SSL)特征嵌入的质量显著提高。尽管如此,许多作者继续认为嵌入基 MIL 优于实例基 MIL。为深入探究这一点,我们在 4 个数据集上进行了 710 项实验,比较了 10 种 MIL 战略、6 种自我监督方法和 4 种后端模型、4 种基础模型以及各种病理特异性技术。此外,我们引入了 4 种新的实例基 MIL 方法,这些方法之前在病理学领域从未被使用过。通过这些广泛的实验,我们展示了,在具有良好 SSL 特征提取器的情况下,具有极少数参数的简单实例基 MIL 方法在 BRACS 和 Camelyon16 数据集上达到或超过了复杂、最先进的嵌入基 MIL 方法的表现,从而设置新的最先进的性能。由于简单实例基 MIL 方法自然更具可解释性和可解释性,我们的结果显示,应该更注重适用于 WSI 的良好适应性 SSL 方法,而不是复杂的嵌入基 MIL 方法。