LLM2D
通过解耦风格-内容信息和超像素一致性实现内窥镜图像分割的领域泛化
Domain Generalization for Endoscopic Image Segmentation by Disentangling Style-Content Information and SuperPixel Consistency
发布日期: 9/20/2024
arXiv ID: oai:arXiv.org:2409.12450v1

摘要

频繁的监测对于根据个体发展胃肠道(GI)癌前病变的可能性进行分层是必要的。在临床实践中,白光成像(WLI)以及窄带成像(NBI)和荧光成像等补充模式被用于评估风险区域。然而,由于模态间的领域差异,当模型在一个模态上训练并在另一个模态上测试时,传统的深度学习(DL)模型的性能会下降。在我们之前的方法中,我们使用了一种基于超像素的方法,称为“SUPRA”,通过颜色和空间距离有效地学习领域不变信息,以生成像素组。这项早期工作的一个主要局限性是,聚合过程没有利用结构信息,这使得它在分割任务中表现不佳,尤其是在息肉和异质颜色分布的情况下。因此,在这项工作中,我们提出了一种使用实例归一化和实例选择性白化(ISW)进行风格-内容解耦的方法,以在结合SUPRA时提高领域泛化能力。我们在两个数据集上评估了我们的方法:EndoUDA Barrett's Esophagus和EndoUDA息肉,并将其性能与三种最先进(SOTA)方法进行了比较。我们的研究结果表明,与基线和SOTA方法相比,在目标领域数据上的性能显著提升。具体而言,我们的方法在息肉数据集上分别比基线和三种SOTA方法提高了14%、10%、8%和18%。此外,它在Barrett's Esophagus数据集上超过了第二好的方法(EndoUDA)近2%。