LLM2D
机器学习中的沙普利交互作用
shapiq: Shapley Interactions for Machine Learning
作者: Maximilian Muschalik, Hubert Baniecki, Fabian Fumagalli, Patrick Kolpaczki, Barbara Hammer, Eyke H\"ullermeier
发布日期: 10/3/2024
arXiv ID: oai:arXiv.org:2410.01649v1

摘要

最初源于博弈论,Shapley 值 (SV) 近年来已成为机器学习研究中重要的工具。最显著的是,它被用于可解释人工智能中的特征归因和数据估值。Shapley 互动 (SIs) 自然地扩展了 SV 并解决了其局限性,通过为实体组分配联合贡献来增强对黑盒机器学习模型的理解。由于计算 SV 和 SIs 的指数级复杂性,人们提出了各种方法,这些方法利用结构性假设或在有限资源的情况下提供概率估计。在这项工作中,我们介绍了 shapiq,一个开源 Python 包,它将最先进的算法统一起来,以在与应用程序无关的框架中高效地计算 SV 和任意阶 SIs。此外,它还包含一个基准套件,其中包含 11 个 SIs 的机器学习应用程序,以及预先计算的游戏和真实值,以系统地评估跨领域的计算性能。对于从业人员来说,shapiq 能够解释和可视化模型预测中的任意阶特征交互,包括视觉转换器、语言模型,以及带有 TreeSHAP-IQ 的 XGBoost 和 LightGBM。借助 shapiq,我们将 shap 扩展到特征归因之外,并巩固了 SV 和 SIs 在机器学习中的应用,这将促进未来的研究。源代码和文档可在 https://github.com/mmschlk/shapiq 获取。