摘要
arXiv:2401.00248v4 宣告类型: replace-cross
摘要: Segment Anything Model(SAM)代表了计算机视觉基础模型的一个重要突破,提供了一个大规模图像分割模型。然而,尽管SAM在零样本设置下表现出色,但其分割掩码在准确界定对象边界方面缺乏细粒度细节。因此,探索SAM是否可以通过二值图像分割(DIS)任务实现高度准确的对象分割既有趣又具有价值。为了解决这个问题,我们提出了DIS-SAM,该模型旨在通过极其准确的细节将SAM推向DIS任务。DIS-SAM是一个专门为高度准确分割设计的框架,保持了SAM的可提示设计。DIS-SAM采用两阶段方法,将SAM与一个修改过的先进网络结合,该网络此前专门设计用于处理无提示的DIS任务。为了更好地训练DIS-SAM,我们通过修改原始掩码注释采用了地面真实增强策略。尽管结构简单,但DIS-SAM显著提升了SAM、HQ-SAM和Pi-SAM的F-measure,分别提高了8.5%、6.9%和3.7%。我们的代码详见 https://github.com/Tennine2077/DIS-SAM