LLM2D

摘要

arXiv:2504.00060v2 通知类型: 交叉替换摘要：随着深度学习的不断进步，神经网络决策的透明性仍然是一个关键挑战，限制了其在高风险领域中的信任度和适用性。类激活映射（CAM）技术已经 emergence 了作为一种关键方法，用于可视化模型决策，但现有方法存在固有的权衡。基于梯度的 CAM 变体由于梯度噪声导致梯度敏感性，从而产生不稳定和不可靠的解释。相反，无梯度方法减轻了梯度不稳定性，但会产生显著的计算成本并增加推理延迟。为了解决这些限制，我们提出了一种 Cluster Filter Class Activation Map（CF-CAM）技术，这是一种新颖的框架，重新引入了基于梯度的加权，同时增强了对梯度噪声的鲁棒性。CF-CAM 使用分层的重要性加权策略来平衡特征区分性和噪声消除。通过基于密度的空间聚类方法（DBSCAN）实现感知语义的相关特征通道的集群，并丢弃容易产生噪声的激活。此外，集群条件下的梯度过滤利用高斯滤波器细化梯度信号，同时保留边缘感知的位置信息并抑制噪声的影响。实验结果表明，CF-CAM 在可解释性性能上表现优越，同时提高了计算效率，其忠实度和鲁棒性超过最先进的 CAM 方法。通过有效地缓解梯度不稳定性而不增加过多的计算成本，CF-CAM 提供了一种在自动驾驶和医疗诊断等关键应用中增强深层神经网络可解释性的竞争性解决方案。