摘要
arXiv:2410.12214v3 交互分割类型: 替换-交叉
摘要:交互分割的目标是在最少的用户交互下准确分割目标对象。然而,当前的方法往往难以准确地将目标对象与背景区分开来,这是因为对场景中物体间相对深度的理解有限。为了解决这个问题,我们提出了一种名为OIS(Order-Aware Interactive Segmentation)的方法,在这种方法中,我们明确地将物体间的相对深度编码到顺序图中。我们引入了一种新颖的顺序感知注意力机制,其中顺序图可以无缝指导用户的交互(形式为点击)关注图像特征。我们还提出了一种对象感知的注意力模块,以整合强对象级别的理解,更好地区分具有相似顺序的对象。我们的方法允许稠密和稀疏的用户点击集成,与先前的工作相比,在准确性和效率上均有所提高。实验结果表明,OIS在HQSeg44K数据集上单次点击后的mIoU提升了7.61,在DAVIS数据集上相较于之前的最佳方法SegNext提升了1.32,同时还将推理速度提高了两倍。项目页面为 https://ukaukaaaa.github.io/projects/OIS/index.html