LLM2D
通过潜空间转移建模标签噪声以校正嘈杂的多标签预测
Correcting Noisy Multilabel Predictions: Modeling Label Noise through Latent Space Shifts
作者: Weipeng Huang, Qin Li, Yang Xiao, Cheng Qiao, Tie Cai, Junwei Liang, Neil J. Hurley, Guangyuan Piao
发布日期: 5/9/2025
arXiv ID: oai:arXiv.org:2502.14281v3

摘要

arXiv:2502.14281v3 宣告类型: replace-cross 摘要:数据中的噪声似乎在大多数实际的机器学习应用中不可避免,并且会导致严重的过拟合问题。不仅数据特征可能包含噪声,标签也由于人类输入的原因而容易产生噪声。在本文中,我们没有关注多类分类中的嘈杂标签学习,而是将注意力集中在尚未被充分探索的多标签分类中的嘈杂标签学习领域。具体来说,我们研究了从使用嘈杂标签学习的分类器生成的预测之后的纠正。有两方面的原因。首先,这种方法可以直接与训练好的模型一起工作,以节省计算资源。其次,它可以在其他嘈杂标签纠正技术的基础上应用,从而获得进一步的改进。为了解决这个问题,我们求助于可能进行不确定性估计的深度生成方法。我们的模型假设标签噪声源自潜在变量的随机偏移,从而为嘈杂学习提供了更稳健和有益的方法。我们为我们的模型开发了无监督学习和半监督学习方法。广泛的实证研究表明,我们的方法能够一贯地改进单独的方法,并且在各种嘈杂标签设置中比许多现有方法表现更好。此外,我们对所提出方法进行了全面的实证分析,以验证其稳健性,包括灵敏度分析和消融研究等其他元素。