LLM2D

摘要

arXiv:2412.03539v2 宣告类型: replace-cross 摘要：理解对抗样本对于改进模型的鲁棒性至关重要，因为对抗样本会给模型引入不可感知的扰动以欺骗模型。因此，有效的对抗样本为通过消除模型奇点来训练更鲁棒的模型提供了潜在机会。我们提出了NODE-AdvGAN，这是一种新颖的方法，将对抗生成视为一个连续的过程，并采用神经常微分方程（NODE）来模拟生成器的动力学。通过模仿传统梯度基方法的迭代性质，NODE-AdvGAN 生成了更平滑和更精确的扰动，这些扰动在添加到良性图像时保留了较高的感知相似性。我们还提出了一种新的训练策略 NODE-AdvGAN-T，在训练过程中调整噪声参数以增强黑盒攻击中的泛化能力。实验表明，NODE-AdvGAN 和 NODE-AdvGAN-T 生成了更有效的对抗样本，在保持更好的感知质量的同时，攻击成功率也高于基线模型。