LLM2D

摘要

无监督实例分割旨在不依赖人工标注数据的情况下分割图像中不同的目标实例。近年来，该领域取得了重大进展，部分原因是自监督模型（如 DINO）提供的丰富的视觉特征表示能够提供强大的局部对应关系。最近的最新方法使用自监督特征将图像表示为图，并解决广义特征值系统（即归一化割）以生成前景掩码。虽然这种策略有效，但它受到其随之而来的计算需求的限制，导致推理速度缓慢。在本文中，我们提出了一种提示和合并 (ProMerge) 方法，该方法利用自监督视觉特征来获取初始的补丁分组，并应用策略性合并到这些片段中，并辅以复杂的基于背景的掩码修剪技术。ProMerge 不仅产生了具有竞争力的结果，而且与基于归一化割的最新方法相比，还显著缩短了推理时间。此外，当使用我们的掩码预测作为伪标签训练目标检测器时，由此产生的检测器在各种具有挑战性的实例分割基准测试中超越了当前领先的无监督模型。