摘要
源无关域适应 (SFDA) 是目标检测中的一个难题,其中预训练的源模型被适应到一个新的目标域,而没有使用任何源域数据,以保护隐私和提高效率。大多数用于目标检测的最新 SFDA 方法都是为 Faster-RCNN 提出的,这是一种以计算复杂度高而闻名的检测器。本文重点研究了面向现实世界视觉系统的域适应技术,特别是针对 YOLO 系列单次检测器,该系列以其快速基线和实际应用而闻名。我们提出的 SFDA 方法——源无关 YOLO (SF-YOLO)——依赖于一个师生框架,其中学生接收带有学习到的、特定于目标域的增强图像,允许模型仅使用未标记的目标数据进行训练,而无需特征对齐。在没有标签的情况下使用均值教师架构进行自训练的一个挑战是,由于噪声或漂移的伪标签,准确率会迅速下降。为了解决这个问题,引入了师生之间的一种通信机制,以帮助稳定训练并减少对模型选择中带注释的目标数据的依赖。尽管我们的方法很简单,但在几个具有挑战性的基准数据集上,它与最先进的检测器具有竞争力,有时甚至超过了使用源数据进行适应的方法。