LLM2D

摘要

本文提出了一种评估归因图的方法，归因图在解释卷积神经网络 (CNN) 的预测中起着核心作用。我们证明了广泛使用的插入/删除指标容易受到影响排名可靠性的分布偏移的影响。我们的方法建议用对抗性扰动代替像素修改，从而提供一个更稳健的评估框架。通过使用平滑度和单调性度量，我们说明了我们的方法在校正分布偏移方面的有效性。此外，我们对归因图进行了迄今为止最全面定量和定性评估。引入基线归因图作为健全性检查，我们发现我们的指标是唯一通过所有检查的指标。利用肯德尔τ等级相关系数，我们展示了我们的指标在 15 个数据集-架构组合中的较高一致性。在测试的 16 个归因图中，我们的结果清楚地表明 SmoothGrad 是目前最好的图。这项研究通过提供一个可靠且一致的评估框架，为归因图的发展做出了重要贡献。为确保可重复性，我们将提供代码以及我们的结果。