LLM2D

摘要

最初源于博弈论，Shapley 值 (SV) 近年来已成为机器学习研究中重要的工具。最显著的是，它被用于可解释人工智能中的特征归因和数据估值。Shapley 互动 (SIs) 自然地扩展了 SV 并解决了其局限性，通过为实体组分配联合贡献来增强对黑盒机器学习模型的理解。由于计算 SV 和 SIs 的指数级复杂性，人们提出了各种方法，这些方法利用结构性假设或在有限资源的情况下提供概率估计。在这项工作中，我们介绍了 shapiq，一个开源 Python 包，它将最先进的算法统一起来，以在与应用程序无关的框架中高效地计算 SV 和任意阶 SIs。此外，它还包含一个基准套件，其中包含 11 个 SIs 的机器学习应用程序，以及预先计算的游戏和真实值，以系统地评估跨领域的计算性能。对于从业人员来说，shapiq 能够解释和可视化模型预测中的任意阶特征交互，包括视觉转换器、语言模型，以及带有 TreeSHAP-IQ 的 XGBoost 和 LightGBM。借助 shapiq，我们将 shap 扩展到特征归因之外，并巩固了 SV 和 SIs 在机器学习中的应用，这将促进未来的研究。源代码和文档可在 https://github.com/mmschlk/shapiq 获取。