LLM2D
DeTrigger: federated Learning 中后门攻击缓解的梯度中心化方法
DeTrigger: A Gradient-Centric Approach to Backdoor Attack Mitigation in Federated Learning
作者: Kichang Lee, Yujin Shin, Jonghyuk Yun, Songkuk Kim, Jun Han, JeongGil Ko
发布日期: 2/4/2025
arXiv ID: oai:arXiv.org:2411.12220v2

摘要

arXiv:2411.12220v2 公告类型: replace-cross 摘要: 联邦学习(FL)在保持本地数据隐私的同时,在分布式设备之间实现了协作模型训练,使其成为移动和嵌入式系统的理想选择。然而,FL 的去中心化特性也使其容易受到模型投毒攻击,特别是后门攻击,其中对手植入触发模式以操纵模型预测。在本文中,我们提出了一种名为 DeTrigger 的可扩展且高效的后门抗联邦学习框架,该框架借鉴了攻击方法论的见解。通过使用温度缩放的梯度分析,DeTrigger 可检测并隔离后门触发器,从而能够在不牺牲良性模型知识的情况下精确修剪后门激活。在四个广泛应用的数据集上进行的广泛评估表明,DeTrigger 的检测速度比传统方法快 251 倍,并且能够通过高达 98.9% 的程度缓解后门攻击,对全球模型准确性的影响最小。我们的研究结果确立了 DeTrigger 作为一种强大的可扩展解决方案,用于保护联邦学习环境免受复杂的后门威胁。