摘要
arXiv:2502.12209v1 宣告类型: cross
摘要: 深度神经网络(DNNs)在支持广泛的应用方面展现了强大的能力。Shapley 值已成为分析特征重要性的重要工具,帮助人们理解深度神经模型的推理过程。计算Shapley值函数需要选择一个基准来代表特征缺失的情况。然而,现有的随机和条件基准可能会负面影响解释。在本文中,通过对不同基准的亚最优性的分析,我们识别出问题基准,其中忠实有影响力的特征 \(\bm{x}'_i\) 和其他特征之间的不对称交互对模型输出具有显著的方向性偏见,并得出结论,\(p(y|\bm{x}'_i) = p(y)\) 可能最小化涉及 \(\bm{x}'_i\) 的不对称交互。我们进一步将 \(\bm{x}'_i\) 对标签空间 \(L\) 的无信息性一般化,以避免估计 \(p(y)\),并设计一种基于不确定性的重新加权机制来加速计算过程。我们在各种自然语言处理任务上进行了实验,我们的定量分析证明了提出基于不确定性的重新加权机制的有效性。此外,通过测量解释方法生成的解释与人类测量的一致性,我们突显了模型推理与人类理解之间的差异。