LLM2D

摘要

arXiv:2502.10723v1 宣告类型: cross 摘要: 数据增强是训练深度神经网络的一项重要技术，因为它能够提高模型的泛化能力和鲁棒性。尽管数据增强常用于扩展样本量并作为一致性正则化项，但关于两者关系的研究却较少。为了解决这一缺口，本文引入了数据增强的更全面的数学框架。通过该框架，我们建立了迁移后的人口的期望风险是原始人口风险和一个差距项之和的关系，该差距项可以被解释为一致性正则化项。本文还对这个差距进行了理论上的理解，强调了其对训练早期阶段的负面影响，并提出了一种缓解这些影响的方法。为了验证我们的方法，我们在多种场景下——包括标准训练、分布外测试和不均衡分类——使用相同的增强技术以及相同的计算资源进行了实验。结果显示，我们的方法在所有场景下的泛化能力和收敛稳定性方面都超过了其他方法。我们还在以下链接中提供了我们的代码实现: https://github.com/ydlsfhll/ASPR。