LLM2D
通过使用对抗生成样本改进基于扰动的深度fake检测器解释方法
Improving the Perturbation-Based Explanation of Deepfake Detectors Through the Use of Adversarially-Generated Samples
作者: Konstantinos Tsigos, Evlampios Apostolidis, Vasileios Mezaris
发布日期: 2/7/2025
arXiv ID: oai:arXiv.org:2502.03957v1

摘要

arXiv:2502.03957v1 公告类型:交叉 摘要:在本文中,我们介绍了一种使用由检测器将输入图像分类为换脸的对抗生成样本来形成扰动掩码的方法,用于推断不同输入特征的重要性并生成可视化解释。我们基于自然进化策略生成这些样本,目的是翻转原始换脸检测器的决策,并将这些样本分类为真实。我们将这一想法应用于四种扰动基于的解释方法(LIME、SHAP、SOBOL 和 RISE),并通过最先进的换脸检测模型、基准数据集(FaceForensics++)和相应的解释评估框架来评估修改后的版本方法的性能。我们定量评估记录了所提出扰动方法在解释方法性能中的主要积极贡献。我们的定性分析显示了修改后的解释方法在更准确地标记篡改图像区域的能力,从而提供更有用的解释。