LLM2D

摘要

arXiv:2505.06684v1 描述标签噪声下的鲁棒性摘要：在联邦学习（FL）中，数据内的标签噪声鲁棒性是一个重大挑战。从数据为中心的角度来看，由于不同客户端的标注包含不同程度的复杂标签噪声，因此无法保证分布式数据集的质量，这导致了性能的下降。已经有一些早期尝试来解决联邦学习中的标签噪声问题。然而，在统一的设置下全面评估这些方法的实际性能的研究仍然不足。为了解决这一问题，我们提出了第一个基准研究FNBench，提供了一个考虑三种不同的标签噪声模式的实验调查，包括合成标签噪声、不完美的人工标注错误和系统性错误。我们的评估包括了在五个图像识别数据集和一个文本分类数据集上采用的十八种最先进的方法。同时，我们提供了关于为什么标签噪声会损害联邦学习的观察，并在此基础上利用一种基于表示感知的正则化方法来增强现有方法在对抗标签噪声时的鲁棒性。最后，我们讨论了这项工作的局限性，并提出了三个方向的未来研究。为了方便相关社区，我们在https://github.com/Sprinter1999/FNBench 开放了我们的源代码。