LLM2D
基于迁移的通用攻击在纯黑盒设置中
On Transfer-based Universal Attacks in Pure Black-box Setting
作者: Mohammad A. A. K. Jalwana, Naveed Akhtar, Ajmal Mian, Nazanin Rahnavard, Mubarak Shah
发布日期: 4/15/2025
arXiv ID: oai:arXiv.org:2504.08866v1

摘要

arXiv:2504.08866v1 安全类型:跨域 摘要:尽管深度视觉模型的表现令人印象深刻,但它们仍然容易受到可转移的黑盒对抗攻击的影响。从根本上说,这些攻击以目标模型无关的方式制造扰动。然而,令人惊讶的是,我们发现现有方法在这一领域无意中依赖了违背黑盒假设的各种先验知识,例如用于训练目标模型的数据集的可用性,以及目标模型中类别的数量。因此,文献未能充分阐述可转移的黑盒攻击的真实威力。我们提供了这些偏差的实证研究,并提出了一种框架,以帮助进行无先验知识的透明研究。利用我们的框架,我们分析了目标模型数据和类别数量的先验知识在攻击性能中的作用。我们还基于我们的分析提供了几个有趣的见解,并表明先验知识会导致可迁移性评分的夸大。最后,我们将我们的框架扩展到基于查询的攻击。这一扩展启发了一种新颖的图像融合技术,用于有效训练替代模型的数据准备。