摘要
arXiv:2504.02019v1 类别: cross
摘要: 增量特征解释主要依赖于博弈论概念,如Shapley值,将特征视为合作玩家。Shapley值在可解释AI内外的流行性源于其公理上的唯一性。然而,其计算复杂性严重限制了其实用性。大多数研究工作致力于所有特征的Shapley值的均匀近似,无目的地耗费样本在不重要的特征上。相反,识别最重要的k个特征已经足够有洞察力,并且有可能利用与多臂 bandits 领域相关的算法机会。我们提出了可比边际贡献抽样(CMCS),这是一种利用相关观测的新抽样方案,用于解决top-k识别问题的方法。我们进行了实验来展示我们的方法在与竞争baseline相比的有效性。我们的实证发现表明,对所有特征的近似问题的估计质量不一定转移到top-k识别问题上,反之亦然。