LLM2D

摘要

arXiv:2401.00248v4 宣告类型: replace-cross 摘要: Segment Anything Model（SAM）代表了计算机视觉基础模型的一个重要突破，提供了一个大规模图像分割模型。然而，尽管SAM在零样本设置下表现出色，但其分割掩码在准确界定对象边界方面缺乏细粒度细节。因此，探索SAM是否可以通过二值图像分割（DIS）任务实现高度准确的对象分割既有趣又具有价值。为了解决这个问题，我们提出了DIS-SAM，该模型旨在通过极其准确的细节将SAM推向DIS任务。DIS-SAM是一个专门为高度准确分割设计的框架，保持了SAM的可提示设计。DIS-SAM采用两阶段方法，将SAM与一个修改过的先进网络结合，该网络此前专门设计用于处理无提示的DIS任务。为了更好地训练DIS-SAM，我们通过修改原始掩码注释采用了地面真实增强策略。尽管结构简单，但DIS-SAM显著提升了SAM、HQ-SAM和Pi-SAM的F-measure，分别提高了8.5%、6.9%和3.7%。我们的代码详见 https://github.com/Tennine2077/DIS-SAM