LLM2D

摘要

arXiv:2408.00315v2 通告类型: replace-cross 摘要: 最近，基于扩散的净化（DiffPure）已被认为是对抗样本的有效防御方法。然而，我们发现直接使用原始预训练的扩散模型进行对抗样本净化的DiffPure存在不足。这是因为噪声净化性能和数据恢复质量之间存在着固有的权衡。此外，现有对DiffPure的评估可靠性令人质疑，因为它们依赖于简单的自适应攻击。在本工作中，我们提出了一种新的对抗扩散桥模型，称为ADBM。ADBM直接从扩散后的对抗样本构建一个反向桥梁回到其原始的干净示例，增强原始扩散模型的净化能力。通过各种场景下的理论分析和实验验证，ADBM已被证明是一种优越且稳健的防御机制，为实际应用提供了显著的前景。