LLM2D
基于扰动的卷积神经网络归因图可靠性评估方法
Reliable Evaluation of Attribution Maps in CNNs: A Perturbation-Based Approach
作者: Lars Nieradzik, Henrike Stephani, Janis Keuper
发布日期: 11/25/2024
arXiv ID: oai:arXiv.org:2411.14946v1

摘要

本文提出了一种评估归因图的方法,归因图在解释卷积神经网络 (CNN) 的预测中起着核心作用。我们证明了广泛使用的插入/删除指标容易受到影响排名可靠性的分布偏移的影响。我们的方法建议用对抗性扰动代替像素修改,从而提供一个更稳健的评估框架。通过使用平滑度和单调性度量,我们说明了我们的方法在校正分布偏移方面的有效性。此外,我们对归因图进行了迄今为止最全面定量和定性评估。引入基线归因图作为健全性检查,我们发现我们的指标是唯一通过所有检查的指标。利用肯德尔τ等级相关系数,我们展示了我们的指标在 15 个数据集-架构组合中的较高一致性。在测试的 16 个归因图中,我们的结果清楚地表明 SmoothGrad 是目前最好的图。这项研究通过提供一个可靠且一致的评估框架,为归因图的发展做出了重要贡献。为确保可重复性,我们将提供代码以及我们的结果。