摘要
机器遗忘(MU)近年来因其在去除训练过的机器学习(ML)模型中特定数据的影响,从而实现安全人工智能的潜力而备受关注。这种被称为知识移除的过程,解决了人工智能治理中训练数据质量、敏感性、版权限制和过时等问题。这种能力对于确保遵守隐私法规,例如“被遗忘权”(RTBF),也至关重要。此外,有效的知识移除可以减轻有害结果的风险,防止偏见、错误信息和未经授权的数据利用,从而增强人工智能系统的安全和负责任的使用。人们一直在努力设计高效的遗忘方法,并研究将 MU 服务与现有的机器学习即服务(MLaaS)集成,允许用户提交从训练语料库中移除特定数据的请求。然而,最近的研究强调了机器遗忘系统中的漏洞,例如信息泄露和恶意遗忘,这些漏洞会导致重大的安全和隐私问题。此外,大量研究表明,遗忘方法和普遍存在的攻击在 MU 系统中发挥着不同的作用。这突出了这些机制在维护系统功能和安全方面错综复杂的关系和复杂互动。本综述旨在弥合机器遗忘中威胁、攻击和防御研究数量众多与缺乏对它们的分类、方法和解决方案的全面综述之间的差距,从而为未来的研究方向和实际应用提供宝贵的见解。