LLM2D

摘要

arXiv:2505.01109v1 Announce Type: 全文摘要: 多实例学习（MIL）已经成为全切片图像（WSI）分类的最佳解决方案。它包括将每张切片分为多个斑块，这些斑块被视为一个带有全局标签的实例集合。MIL 包含两种主要方法：实例基和嵌入基。在实例基方法中，每个斑块独立分类，然后汇总斑块评分以预测集合标签。而在嵌入基方法中，在汇总斑块嵌入后进行集合分类。尽管实例基方法自然更具可解释性，但在过去，嵌入基 MIL 由于其对差特征提取器的鲁棒性而常用。然而，最近，通过自我监督学习（SSL）特征嵌入的质量显著提高。尽管如此，许多作者继续认为嵌入基 MIL 优于实例基 MIL。为深入探究这一点，我们在 4 个数据集上进行了 710 项实验，比较了 10 种 MIL 战略、6 种自我监督方法和 4 种后端模型、4 种基础模型以及各种病理特异性技术。此外，我们引入了 4 种新的实例基 MIL 方法，这些方法之前在病理学领域从未被使用过。通过这些广泛的实验，我们展示了，在具有良好 SSL 特征提取器的情况下，具有极少数参数的简单实例基 MIL 方法在 BRACS 和 Camelyon16 数据集上达到或超过了复杂、最先进的嵌入基 MIL 方法的表现，从而设置新的最先进的性能。由于简单实例基 MIL 方法自然更具可解释性和可解释性，我们的结果显示，应该更注重适用于 WSI 的良好适应性 SSL 方法，而不是复杂的嵌入基 MIL 方法。