摘要
arXiv:2409.13349v2 通知类型: 交叉替换
摘要:基于深度学习的面部操控的滥用对公民权利构成了重大威胁。为了在源头上防止这种欺诈行为,已经提出了主动防御方法,通过向图片中添加不可见的对抗性扰动来破坏操控过程,使伪造的输出对观察者来说不具说服力。然而,对输出的非特定破坏可能会保留可识别的面部特征,从而可能导致个体受到污名化。本文提出了一种通用框架,称作ID-Guard,用于应对面部操控。具体而言,该框架利用编码-解码网络的一次前向传播过程,生成跨模型转移的对抗性扰动。引入了一种新的身份破坏模块(IDM),用于降解伪造面部中的可识别特征。通过将对不同面部操控的破坏视为一个多任务学习问题来优化扰动的生成,并且设计了一种动态权重策略以增强跨模型性能。实验结果表明,提出的ID-Guard在对抗各种面部操控模型方面表现出强大的防御效果,有效地降解了操控图片中的可识别区域。它还使被破坏的图片能够逃避面部修复和图像识别系统。此外,ID-Guard可以无缝地用作即插即用组件,与其他任务如对抗性训练等整合。