摘要
arXiv:2503.20230v1 公告类型: cross
摘要: 卷积神经网络(CNNs)在各种计算机视觉任务中取得了显著的成功。然而,它们本质上并不是可解释的。虽然基于特征的 CNN 理解揭示了模型关注的位置,但基于概念的解释方法提供了模型所见的见解。然而,它们关于图像激活的线性重构假设未能捕捉这些激活之间的复杂关系。它们用于评估全局解释的忠实性度量方法也提出了一个新问题。首次,我们通过引入新颖的Transformative 非线性概念解释器(TraNCE)来解决这些问题,适用于 CNNs。与现有方法中做出的线性重构假设不同,TraNCE 能够捕捉激活之间的复杂关系。这项研究在 CNN 解释文献中提出了三个原始贡献:(i)基于变分自编码器(VAE)的自动概念发现机制。这一变革性概念发现过程增强了从图像激活中识别有意义概念的能力。(ii)一个利用球贝塞尔函数的可视化模块,以平滑过渡原型图像像素,不仅揭示了 CNN 所见,还揭示了 CNN 所避免的内容,从而缓解了之前工作记录的概念重复挑战。(iii)一个全新的度量标准,即 Faith 分数,结合 Coherence 和 Fidelity,进行全面评估解释器的忠实性和一致性。