LLM2D

摘要

arXiv:2310.13019v5 Announce Type: replace-cross 摘要：深度神经网络（DNNs）对对抗攻击的敏感性削弱了其在众多应用中的可靠性，强调了深入探讨这些漏洞并制定稳健防御策略的必要性。Moosavi-Dezfoolly等人（2016）提出的DeepFool算法是识别引起输入图像误分类所需最小扰动的关键一步。然而，其通用方法在需要有针对性干预的情景中表现不佳。此外，先前的研究大多集中在攻击的成功率上，而没有充分解决随之而来的图像畸变、图像质量的保持或误分类所需的置信阈值。为弥补这些差距，我们介绍了改进的目标DeepFool（ET DeepFool）算法，这是DeepFool的一种演变，不仅能够指定期望的误分类目标，还集成了可配置的最小置信分数。我们的实证研究展示了这种改进方法在保持图像完整性和减少各种DNN架构的扰动方面的优越性。与Gajjar等人（2022）的Targeted DeepFool等先前版本相比，我们的方法提供了对扰动过程无可比拟的控制，能够精确操控模型的响应。初步结果表明，包括AlexNet和先进的Vision Transformer在内的某些模型对这种操控表现出出色的鲁棒性。通过我们对置信水平的调整揭示的模型不同水平的鲁棒性发现，可能对图像识别领域产生深远的影响。我们的代码可在 https://github.com/FazleLabib/et_deepfool 获取。