LLM2D
CF-CAM:梯度扰动缓解与特征稳定化以实现可靠可解释性
CF-CAM: Gradient Perturbation Mitigation and Feature Stabilization for Reliable Interpretability
作者: Hongjie He, Xu Pan, Yudong Yao
发布日期: 4/2/2025
arXiv ID: oai:arXiv.org:2504.00060v1

摘要

arXiv:2504.00060v1 宣布类型: cross 摘要:随着深度学习的不断进步,神经网络决策的不透明性仍然是一个关键挑战,限制了其在高风险领域的信任度和应用范围。类激活映射(CAM)技术已经成为了可视化模型决策的关键方法,然而现有方法面临着固有的权衡。基于梯度的CAM变体受到梯度扰动的敏感性影响,导致解释不稳定和不可靠。相反,无梯度方法减轻了梯度不稳定性,但会带来显著的计算开销和推断延迟。为了解决这些限制,我们提出了一种新颖的框架——聚类过滤类激活映射(CF-CAM),该框架重新引入了基于梯度的加权方法,同时增强了对梯度噪声的鲁棒性。CF-CAM采用层次的重要性加权策略,平衡了 discriminative 特征的保留和噪声的消除。通过基于密度的通道聚类(使用噪声数据的基于密度的空间聚类算法 DBSCAN),CF-CAM 对语义相关的特征通道进行分组,并丢弃易受噪声影响的激活。此外,集群条件下的梯度过滤利用双边滤波器精炼梯度信号,同时保持边缘感知的定位,抑制噪声的影响。实验结果表明,CF-CAM 在可解释性方面表现出优越性能,同时保持对梯度扰动的鲁棒性,优于最先进的 CAM 方法在忠实度和鲁棒性方面。通过有效地减轻梯度不稳定性,而无需额外的计算成本,CF-CAM 为在医疗诊断和自动驾驶等关键应用中增强深度神经网络的可解释性提供了一个可靠解决方案。