摘要
arXiv:2503.22759v1 交叉公告类型: cross
摘要:深度学习已经成为现代人工智能的基石,使其能够在众多领域实现革命性的应用。作为深度学习的核心要素,训练数据的质量和安全性对模型的性能和可靠性至关重要。然而,在训练过程中,深度学习模型面临着数据中毒的重大威胁,即攻击者通过引入恶意篡改的数据来降低模型准确性或导致异常行为。虽然现有的综述提供了有关数据中毒的宝贵见解,但它们通常从广泛的视角出发,既涵盖了攻击也涵盖了防御,但在深度学习中的数据中毒攻击方面缺乏专门的深入分析。在这篇文章综述中,我们通过呈现深度学习中数据中毒的全面且针对性的回顾来填补这一空白。首先,这篇综述从多个角度对数据中毒攻击进行分类,深入分析了它们的特征和潜在的设计原理。其次,讨论扩展到大数据量语言模型(LLMs)中的数据中毒新兴领域。最后,我们探讨了该领域的关键开放挑战,并提出潜在的研究方向以进一步推动该领域的发展。为了支持进一步的研究探索,有关深度学习中数据中毒的最新资源库可在https://github.com/Pinlong-Zhao/Data-Poisoning 提供。