LLM2D

摘要

arXiv:2502.14281v1 类别：交叉摘要：在大多数实际的机器学习应用中，数据中的噪声似乎是不可避免的，这会导致严重的过拟合问题。数据特征不仅仅是噪声的来源，标签也容易因为人为输入而变得噪声化。在本文中，我们不是关注多类别分类中的噪声标签学习，而是专注于噪声标签学习在多标签分类中的更未探索的领域。具体来说，我们研究了基于使用噪声标签训练的分类器生成的预测的后校正。原因有两个方面。首先，这种方法可以直接与训练好的模型结合使用，以节省计算资源。其次，它可以应用于其他噪声标签校正技术之上，以实现进一步的改进。为了解决这一问题，我们求助于可能实现不确定性估计的深度生成方法。我们的模型假设标签噪声源自潜在变量的随机位移，从而提供了一种更稳健和有益的噪声学习方式。我们为我们的模型开发了无监督和半监督学习方法。广泛的实验研究提供了确凿的证据，表明我们的方法能够一致地改进独立模型，并且在各种噪声标签设置中在多种现有方法中表现出更好的性能。此外，我们进行了全面的实证分析以验证所提出方法的稳健性，包括敏感性分析和消融研究等其他元素。