LLM2D

摘要

在许多应用中，例如医学影像、自动驾驶和遥感，如何在没有标记数据的情况下将机器学习模型适应新的领域，尤其是在源数据不可访问的情况下，是一个关键挑战。这项任务被称为无源数据无监督域适应 (SFUDA)，它涉及仅使用未标记的目标数据将预训练模型适应目标领域，这可能导致过拟合、欠拟合以及由于领域差异和噪声而导致的泛化能力差等问题。现有的 SFUDA 方法通常依赖于单模型架构，难以应对目标域中的不确定性和可变性。为了应对这些挑战，我们提出了 DRIVE（通过信息可变性和熵实现的双重鲁棒性）框架，这是一种利用双模型架构的新型 SFUDA 框架。两个模型以相同的权重初始化，并行工作以捕捉不同的目标域特征。一个模型通过投影梯度下降 (PGD)（由互信息引导）暴露于扰动中，专注于高不确定性区域。我们还引入了一种熵感知伪标签策略，该策略根据预测不确定性调整标签权重，确保模型关注可靠数据，同时避免噪声区域。适应过程分为两个阶段：第一阶段使用互信息一致性损失在稳定特征上对齐模型；第二阶段根据第一阶段的损失动态调整扰动水平，鼓励模型探索目标域的更广泛范围，同时保持现有性能。这增强了泛化能力和抗干扰能力。在标准 SFUDA 基准上的评估表明，DRIVE 始终优于以前的方法，在复杂的 target domains 中实现了改进的适应精度和稳定性。