LLM2D
ABE:一种统一的基于归因的稳健且忠实可解释性框架
ABE: A Unified Framework for Robust and Faithful Attribution-Based Explainability
作者: Zhiyu Zhu, Jiayu Zhang, Zhibo Jin, Fang Chen, Jianlong Zhou
发布日期: 5/13/2025
arXiv ID: oai:arXiv.org:2505.06258v1

摘要

arXiv:2505.06258v1 Announce Type: cross 摘要:归因算法对于通过识别驱动模型决策的关键特征来增强深度学习模型的可解释性和可信度至关重要。现有的框架,如InterpretDL和OmniXAI,集成了多种归因方法,但存在可扩展性限制、高度耦合、理论约束以及缺乏用户友好的实现等问题,阻碍了神经网络的透明性和互操作性。为了解决这些挑战,我们提出了基于归因的可解释性(ABE),这是一种统一框架,它形式化了基本归因方法,并集成了最先进的归因算法,同时确保符合归因公理。ABE 允许研究人员开发新的归因技术,通过四个可定制的模块:鲁棒性、可解释性、验证和数据与模型来增强可解释性。该框架提供了一个可扩展、可扩展的基础,用于推进基于归因的可解释性,并促进透明的人工智能系统。我们的代码可在以下地址获取:https://github.com/LMBTough/ABE-XAI。