LLM2D

摘要

arXiv:2204.12833v3 转移学习类型: 替换交叉摘要：在新目标任务上训练深度神经网络时，转移学习至关重要。当前的转移学习方法总是假设至少满足以下之一的前提条件：(i) 源任务和目标任务的标签空间重叠；(ii) 源数据集可用；(iii) 目标网络架构与源网络架构一致。然而，在实际场景中保持这些假设是困难的，因为目标任务很少与源任务具有相同的标签，源数据集由于存储成本和隐私限制而无法访问，并且目标架构往往针对每个任务进行了专门化。为了在不依赖这些假设的情况下转移源知识，我们提出了一种使用深层生成模型的转移学习方法，该方法包括两个阶段：伪预训练（PP）和伪半监督学习（P-SSL）。PP 使用条件源生成模型合成的假数据集来训练目标架构。P-SSL 对带有标签的目标数据和由级联源分类器和生成模型生成的伪样本（这些伪样本是根据目标样本条件化）应用半监督学习算法。我们的实验结果表明，我们的方法可以超过从头开始训练和知识蒸馏的基线方法。