LLM2D

摘要

源无关域适应 (SFDA) 是目标检测中的一个难题，其中预训练的源模型被适应到一个新的目标域，而没有使用任何源域数据，以保护隐私和提高效率。大多数用于目标检测的最新 SFDA 方法都是为 Faster-RCNN 提出的，这是一种以计算复杂度高而闻名的检测器。本文重点研究了面向现实世界视觉系统的域适应技术，特别是针对 YOLO 系列单次检测器，该系列以其快速基线和实际应用而闻名。我们提出的 SFDA 方法——源无关 YOLO (SF-YOLO)——依赖于一个师生框架，其中学生接收带有学习到的、特定于目标域的增强图像，允许模型仅使用未标记的目标数据进行训练，而无需特征对齐。在没有标签的情况下使用均值教师架构进行自训练的一个挑战是，由于噪声或漂移的伪标签，准确率会迅速下降。为了解决这个问题，引入了师生之间的一种通信机制，以帮助稳定训练并减少对模型选择中带注释的目标数据的依赖。尽管我们的方法很简单，但在几个具有挑战性的基准数据集上，它与最先进的检测器具有竞争力，有时甚至超过了使用源数据进行适应的方法。