LLM2D

摘要

arXiv:2502.10311v1 通告类型: cross 摘要: 大多数常用的非线性机器学习方法都是黑盒模型，对人类不可解释。可解释人工智能（XAI）领域的目标是开发工具来检查这些黑盒的内部机制。XAI中常用的一种模型无关的方法是使用简单的模型作为局部近似，以生成所谓的局部解释；这种方法的示例包括 LIME、SHAP 和 SLISEMAP。本文展示了如何将大量局部解释缩减为一个小的“代理集”，该代理集可以作为生成性的全局解释发挥作用。这种缩减过程可以形式化为一个优化问题，并且可以通过贪婪启发式方法高效地近似。