LLM2D
基于DeepFool算法对深度神经网络进行 targeted class manipulation 的 adversarial attacks 整形
Tailoring Adversarial Attacks on Deep Neural Networks for Targeted Class Manipulation Using DeepFool Algorithm
作者: S. M. Fazle Rabby Labib, Joyanta Jyoti Mondal, Meem Arafat Manab, Xi Xiao, Sarfaraz Newaz
发布日期: 4/15/2025
arXiv ID: oai:arXiv.org:2310.13019v5

摘要

arXiv:2310.13019v5 Announce Type: replace-cross 摘要:深度神经网络(DNNs)对对抗攻击的敏感性削弱了其在众多应用中的可靠性,强调了深入探讨这些漏洞并制定稳健防御策略的必要性。Moosavi-Dezfoolly等人(2016)提出的DeepFool算法是识别引起输入图像误分类所需最小扰动的关键一步。然而,其通用方法在需要有针对性干预的情景中表现不佳。此外,先前的研究大多集中在攻击的成功率上,而没有充分解决随之而来的图像畸变、图像质量的保持或误分类所需的置信阈值。为弥补这些差距,我们介绍了改进的目标DeepFool(ET DeepFool)算法,这是DeepFool的一种演变,不仅能够指定期望的误分类目标,还集成了可配置的最小置信分数。我们的实证研究展示了这种改进方法在保持图像完整性和减少各种DNN架构的扰动方面的优越性。与Gajjar等人(2022)的Targeted DeepFool等先前版本相比,我们的方法提供了对扰动过程无可比拟的控制,能够精确操控模型的响应。初步结果表明,包括AlexNet和先进的Vision Transformer在内的某些模型对这种操控表现出出色的鲁棒性。通过我们对置信水平的调整揭示的模型不同水平的鲁棒性发现,可能对图像识别领域产生深远的影响。我们的代码可在 https://github.com/FazleLabib/et_deepfool 获取。