摘要
联邦学习(FL)系统容易受到对抗性攻击,恶意客户端会提交中毒模型来破坏收敛或植入后门,导致全局模型错误分类某些样本。当前的防御方法在现实世界的 FL 系统中往往不切实际,因为它们要么依赖于不切实际的先验知识,要么即使在没有攻击的情况下也会导致精度损失。此外,这些方法缺乏执行验证协议,导致参与者不确定机制的正确执行。为了解决这些挑战,我们提出了一种针对现实世界 FL 系统的新型异常检测策略。我们的方法仅在检测到潜在攻击时才激活防御,并能够移除恶意模型而不影响良性模型。此外,我们还将零知识证明纳入其中,以确保所提出的防御机制的完整性。实验结果表明,我们的方法在各种机器学习任务中针对一系列对抗性攻击有效地增强了 FL 系统的安全性。