LLM2D

摘要

arXiv:2411.12220v2 公告类型: replace-cross 摘要: 联邦学习（FL）在保持本地数据隐私的同时，在分布式设备之间实现了协作模型训练，使其成为移动和嵌入式系统的理想选择。然而，FL 的去中心化特性也使其容易受到模型投毒攻击，特别是后门攻击，其中对手植入触发模式以操纵模型预测。在本文中，我们提出了一种名为 DeTrigger 的可扩展且高效的后门抗联邦学习框架，该框架借鉴了攻击方法论的见解。通过使用温度缩放的梯度分析，DeTrigger 可检测并隔离后门触发器，从而能够在不牺牲良性模型知识的情况下精确修剪后门激活。在四个广泛应用的数据集上进行的广泛评估表明，DeTrigger 的检测速度比传统方法快 251 倍，并且能够通过高达 98.9% 的程度缓解后门攻击，对全球模型准确性的影响最小。我们的研究结果确立了 DeTrigger 作为一种强大的可扩展解决方案，用于保护联邦学习环境免受复杂的后门威胁。