LLM2D
修正噪声多标签预测:通过潜在空间变换建模标签噪声
Correcting Noisy Multilabel Predictions: Modeling Label Noise through Latent Space Shifts
作者: Weipeng Huang, Qin Li, Yang Xiao, Cheng Qiao, Tie Cai, Junwei Liao, Neil J. Hurley, Guangyuan Piao
发布日期: 2/21/2025
arXiv ID: oai:arXiv.org:2502.14281v1

摘要

arXiv:2502.14281v1 类别:交叉 摘要:在大多数实际的机器学习应用中,数据中的噪声似乎是不可避免的,这会导致严重的过拟合问题。数据特征不仅仅是噪声的来源,标签也容易因为人为输入而变得噪声化。在本文中,我们不是关注多类别分类中的噪声标签学习,而是专注于噪声标签学习在多标签分类中的更未探索的领域。具体来说,我们研究了基于使用噪声标签训练的分类器生成的预测的后校正。原因有两个方面。首先,这种方法可以直接与训练好的模型结合使用,以节省计算资源。其次,它可以应用于其他噪声标签校正技术之上,以实现进一步的改进。为了解决这一问题,我们求助于可能实现不确定性估计的深度生成方法。我们的模型假设标签噪声源自潜在变量的随机位移,从而提供了一种更稳健和有益的噪声学习方式。我们为我们的模型开发了无监督和半监督学习方法。广泛的实验研究提供了确凿的证据,表明我们的方法能够一致地改进独立模型,并且在各种噪声标签设置中在多种现有方法中表现出更好的性能。此外,我们进行了全面的实证分析以验证所提出方法的稳健性,包括敏感性分析和消融研究等其他元素。