摘要
arXiv:2410.08336v2 宣告类型: replace-cross
摘要: Banzhaf 值提供了一种流行的、可解释的特征重要性量化方法,作为广泛使用的 Shapley 值的替代方案。与 Shapley 值类似,精确计算 Banzhaf 值需要的时间为特征数量的指数级,因此需要使用高效估计器。然而,现有估计器仅限于蒙特卡洛采样方法。在本文中,我们介绍了 Kernel Banzhaf,这是首个用于 Banzhaf 值的回归估计器。我们的方法利用了一种新颖的回归公式,其精确解对应于精确的 Banzhaf 值。受到 Kernel SHAP 在 Shapley 值上取得成功的启发,Kernel Banzhaf 高效地解决了这一回归问题的一个采样实例。通过在八个数据集上的实证评估,我们发现 Kernel Banzhaf 在准确性、采样效率、对噪声的鲁棒性以及特征排名恢复方面显著优于现有的蒙特卡洛方法。最后,我们通过强大的理论保证补充了 Kernel Banzhaf 性能的实验评估。