摘要
arXiv:2412.04682v2 适配类型: 替换-交叉
摘要:最近在无监督领域适应(UDA)方面的进展使得可以使用机器学习(ML)模型对目标数据进行无监督预测,从而加速诸如自动驾驶中的图像识别任务等实际应用。研究人员报告称,在标签源数据由单调颜色的手写数字数据组成而无监督目标数据由街景中的彩色数字数据组成的情况下,无监督领域适应技术在大规模共变移位问题上表现不佳。因此,需要一种方法来解决共变移位问题,并在这一动态下转移源标签规则。我们采用了两阶段域不变表示学习,以通过语义中间数据(无监督)弥合源和目标之间的差距。所提出的方法可以在源和中间体之间以及中间体和目标之间同时学习域不变特征。最终,这种方法通过源标签实现了源和目标之间的良好域不变表示,以及任务可判别性。这种归纳法极大地简化了目标数据分类性能收敛过程中的梯度下降搜索。我们还推导出一个测度已训练模型与无监督目标标签规则之间差距的定理,这对于自由参数优化是必要的。最后,我们使用包括38个无监督领域适应任务的4个代表性机器学习分类数据集证明了所提方法优于先前的UDA方法。我们的实验将成为处理大规模共变移位的UDA问题的基础。