摘要
在许多应用中,例如医学影像、自动驾驶和遥感,如何在没有标记数据的情况下将机器学习模型适应新的领域,尤其是在源数据不可访问的情况下,是一个关键挑战。这项任务被称为无源数据无监督域适应 (SFUDA),它涉及仅使用未标记的目标数据将预训练模型适应目标领域,这可能导致过拟合、欠拟合以及由于领域差异和噪声而导致的泛化能力差等问题。现有的 SFUDA 方法通常依赖于单模型架构,难以应对目标域中的不确定性和可变性。为了应对这些挑战,我们提出了 DRIVE(通过信息可变性和熵实现的双重鲁棒性)框架,这是一种利用双模型架构的新型 SFUDA 框架。两个模型以相同的权重初始化,并行工作以捕捉不同的目标域特征。一个模型通过投影梯度下降 (PGD)(由互信息引导)暴露于扰动中,专注于高不确定性区域。我们还引入了一种熵感知伪标签策略,该策略根据预测不确定性调整标签权重,确保模型关注可靠数据,同时避免噪声区域。适应过程分为两个阶段:第一阶段使用互信息一致性损失在稳定特征上对齐模型;第二阶段根据第一阶段的损失动态调整扰动水平,鼓励模型探索目标域的更广泛范围,同时保持现有性能。这增强了泛化能力和抗干扰能力。在标准 SFUDA 基准上的评估表明,DRIVE 始终优于以前的方法,在复杂的 target domains 中实现了改进的适应精度和稳定性。