摘要
深度学习模型,例如用于人脸识别和属性预测的模型,容易受到对抗性噪声和非故意噪声(包括高斯噪声和脉冲噪声)的操纵。本文介绍了 CIAI,一种基于改进的视觉转换器并带有检测层的类别无关对抗意图检测网络。CIAI 采用了一种新颖的损失函数,将最大均值差异和中心损失相结合,以检测有意(对抗攻击)和无意噪声,而不管图像类别如何。它以多步方式进行训练。我们还在检测过程中引入了意图方面,这可以作为额外的安全层。我们进一步展示了我们提出的检测器在 CelebA、CelebA-HQ、LFW、AgeDB 和 CIFAR-10 数据集上的性能。我们的检测器能够检测有意(如 FGSM、PGD 和 DeepFool)和无意(如高斯噪声和椒盐噪声)扰动。