摘要
传统的目标检测方法基于封闭集假设,即模型只能检测训练集中预定义的固定数量的目标。最近关于开放词汇目标检测 (OVD) 的工作能够检测由无限词汇表定义的目标,这降低了针对特定任务训练模型的成本。然而,OVD 严重依赖于“先知”提供的准确提示,这限制了其在自动驾驶场景感知等关键应用中的使用。OVD 模型倾向于错误分类与已知类别语义相似的近似分布外 (NOOD) 对象,并忽略远分布外 (FOOD) 对象。为了解决这些限制,我们提出一个框架,使 OVD 模型能够在开放世界环境中运行,通过识别和增量学习新的目标。为了检测 FOOD 对象,我们提出了开放世界嵌入学习 (OWEL),并引入了伪未知嵌入的概念,该概念基于已知类别的信息推断未知类别在连续语义空间中的位置。我们还提出了多尺度对比锚点学习 (MSCAL),它通过提升不同尺度下目标嵌入的类内一致性来识别错误分类的未知对象。该方法在常见的开放世界目标检测和自动驾驶基准测试中取得了最先进的性能。