LLM2D
增强对抗攻击的可迁移性:基于梯度编辑的综合框架GE-AdvGAN+
Enhancing Transferability of Adversarial Attacks with GE-AdvGAN+: A Comprehensive Framework for Gradient Editing
发布日期: 9/23/2024
arXiv ID: oai:arXiv.org:2408.12673v3

摘要

可迁移对抗攻击对深度神经网络构成重大威胁,尤其是在黑盒场景中,内部模型信息无法访问。研究对抗攻击方法有助于提升防御机制的性能并探索模型的脆弱性。这些方法能够揭示并利用模型的弱点,推动更健壮架构的发展。然而,当前的可迁移攻击方法往往伴随着巨大的计算成本,限制了其在边缘计算场景中的部署和应用。对抗生成模型,如生成对抗网络(GANs),以其能够在初始训练阶段后无需重新训练即可生成样本的能力而著称。GE-AdvGAN是一种基于此原理的最新可迁移对抗攻击方法。本文提出了一种基于梯度编辑的新型通用可迁移攻击框架,命名为GE-AdvGAN+,该框架集成了几乎所有主流攻击方法,以增强可迁移性并显著减少计算资源消耗。我们的实验证明了该框架的兼容性和有效性。与基线AdvGAN相比,我们表现最佳的方法GE-AdvGAN++实现了平均ASR提升47.8。此外,它还超越了最新的竞争算法GE-AdvGAN,平均ASR增加了5.9。该框架还表现出更高的计算效率,达到2217.7 FPS,优于传统的BIM和MI-FGSM等方法。我们的GE-AdvGAN+框架的实现代码可在https://github.com/GEAdvGANP获取。