LLM2D
全局反事实方向
Global Counterfactual Directions
作者: Bartlomiej Sobieski, Przemys{\l}aw Biecek
发布日期: 2/6/2025
arXiv ID: oai:arXiv.org:2404.12488v3

摘要

arXiv:2404.12488v3 通知类型: 替换-交叉 摘要: 尽管在生成视觉反事实解释的方法开发方面取得了不断增加的进步,尤其是在去噪扩散概率模型的兴起之后,之前的 works 将其视为一种完全局部的技术。在本文中,我们采取了使它们全球化的第一步。具体而言,我们发现扩散自编码器的潜在空间以全局方向的形式编码了给定分类器的推理过程。我们提出了一种基于代理的新颖方法,仅使用单张图像以完全黑盒的方式发现两种类型的方向。具体来说,g 方向允许在图像数据集上翻转给定分类器的决策,而 h 方向则进一步增加了解释的多样性。我们将它们统称为全局反事实方向 (GCD)。此外,我们展示了 GCD 可以自然地与潜在积分梯度相结合,形成一种新的黑盒归因方法,同时提高对反事实解释的理解。我们在现有基准上验证了我们的方法,并展示了它适用于实际应用场景。