LLM2D
一种用于全切片图像的轻量级且可扩展的细胞分割与分类模型
A Lightweight and Extensible Cell Segmentation and Classification Model for Whole Slide Images
作者: Nikita Shvetsov, Thomas K. Kilvaer, Masoud Tafavvoghi, Anders Sildnes, Kajsa M{\o}llersen, Lill-Tove Rasmussen Busund, Lars Ailo Bongo
发布日期: 4/10/2025
arXiv ID: oai:arXiv.org:2502.19217v2

摘要

arXiv:2502.19217v2 通知类型: replace-cross 摘要:在数字病理学中开发临床有用的动力单元级分析工具仍然具有挑战性,主要原因在于数据集粒度的限制、标注不一致、高计算需求以及难以将新技术整合到工作流程中。为了解决这些问题,我们提出了一种解决方案,通过创建一种轻量级、可扩展的动力单元分割和分类模型来提高数据质量、模型性能和易用性。首先,我们通过交叉重新标注更新数据标签,以细化PanNuke和MoNuSAC的动力单元注释,生成一个包含七种不同动力单元类型的统一数据集。其次,我们利用H-Optimus基础模型作为固定编码器,以改进同时进行分割和分类任务的特征表示。第三,为了应对基础模型的计算需求,我们通过知识蒸馏减少模型大小和复杂性,同时保持可比的性能。最后,我们将蒸馏后的模型集成到QuPath这款广泛使用的开源数字病理学平台中。结果显示,与基于CNN的模型相比,基于H-Optimus的模型在分割和分类性能上有所提高。具体而言,平均 $R^2$ 从0.575提高到0.871,平均 $PQ$ 分数从0.450提高到0.492,表明更好地与实际细胞数量对齐,并提高了分割质量。蒸馏后的模型在保持性能可比的同时,参数数量减少了48倍。通过减少计算复杂性并集成到工作流程中,这种方法可能会对诊断产生显著影响,减轻病理学家的工作负担,并改善结果。尽管该方法表现出潜力,但在临床部署之前仍需进行广泛的验证。