LLM2D
DLBacktrace:任何深度学习模型的模型无感知解释性
DLBacktrace: A Model Agnostic Explainability for any Deep Learning Models
作者: Vinay Kumar Sankarapu, Chintan Chitroda, Yashwardhan Rathore, Neeraj Kumar Singh, Pratinav Seth
发布日期: 2/5/2025
arXiv ID: oai:arXiv.org:2411.12643v2

摘要

arXiv:2411.12643v2 宣告类型: replace-cross 摘要:AI 的迅速发展导致了更复杂的深度学习模型,这些模型常常以“黑盒”方式运作,对其决策过程的透明度有限。这种解释性不足在高风险应用场景中尤其构成挑战,因为理解模型输出变得至关重要。本工作突显了可解释性在培养信任、可问责性和负责任部署方面的重要性。为应对这些挑战,我们引入了 DLBacktrace,这是一种新型的、面向所有模型的技术,旨在为不同领域和架构(包括MLP、CNN 和基于Transformer的大语言模型)的深度学习模型决策提供清晰的洞察。我们全面介绍了DLBacktrace,并将其性能与已经建立的可解释性方法(如SHAP、LIME和GradCAM)进行了基准测试。我们的结果显示,DLBacktrace能有效地增强对各种任务中模型行为的理解。DLBacktrace与PyTorch和TensorFlow开发的模型兼容,支持如BERT、ResNet、U-Net和自定义的表格数据DNN等架构。该库已开源,可在 https://github.com/AryaXAI/DLBacktrace 获取。