摘要
arXiv:2502.10311v1 通告类型: cross
摘要: 大多数常用的非线性机器学习方法都是黑盒模型,对人类不可解释。可解释人工智能(XAI)领域的目标是开发工具来检查这些黑盒的内部机制。XAI中常用的一种模型无关的方法是使用简单的模型作为局部近似,以生成所谓的局部解释;这种方法的示例包括 LIME、SHAP 和 SLISEMAP。本文展示了如何将大量局部解释缩减为一个小的“代理集”,该代理集可以作为生成性的全局解释发挥作用。这种缩减过程可以形式化为一个优化问题,并且可以通过贪婪启发式方法高效地近似。