LLM2D

摘要

arXiv:2502.12209v1 宣告类型: cross 摘要: 深度神经网络（DNNs）在支持广泛的应用方面展现了强大的能力。Shapley 值已成为分析特征重要性的重要工具，帮助人们理解深度神经模型的推理过程。计算Shapley值函数需要选择一个基准来代表特征缺失的情况。然而，现有的随机和条件基准可能会负面影响解释。在本文中，通过对不同基准的亚最优性的分析，我们识别出问题基准，其中忠实有影响力的特征 \(\bm{x}'_i\) 和其他特征之间的不对称交互对模型输出具有显著的方向性偏见，并得出结论，\(p(y|\bm{x}'_i) = p(y)\) 可能最小化涉及 \(\bm{x}'_i\) 的不对称交互。我们进一步将 \(\bm{x}'_i\) 对标签空间 \(L\) 的无信息性一般化，以避免估计 \(p(y)\)，并设计一种基于不确定性的重新加权机制来加速计算过程。我们在各种自然语言处理任务上进行了实验，我们的定量分析证明了提出基于不确定性的重新加权机制的有效性。此外，通过测量解释方法生成的解释与人类测量的一致性，我们突显了模型推理与人类理解之间的差异。