摘要
arXiv:2411.12643v2 宣告类型: replace-cross
摘要:AI 的迅速发展导致了更复杂的深度学习模型,这些模型常常以“黑盒”方式运作,对其决策过程的透明度有限。这种解释性不足在高风险应用场景中尤其构成挑战,因为理解模型输出变得至关重要。本工作突显了可解释性在培养信任、可问责性和负责任部署方面的重要性。为应对这些挑战,我们引入了 DLBacktrace,这是一种新型的、面向所有模型的技术,旨在为不同领域和架构(包括MLP、CNN 和基于Transformer的大语言模型)的深度学习模型决策提供清晰的洞察。我们全面介绍了DLBacktrace,并将其性能与已经建立的可解释性方法(如SHAP、LIME和GradCAM)进行了基准测试。我们的结果显示,DLBacktrace能有效地增强对各种任务中模型行为的理解。DLBacktrace与PyTorch和TensorFlow开发的模型兼容,支持如BERT、ResNet、U-Net和自定义的表格数据DNN等架构。该库已开源,可在 https://github.com/AryaXAI/DLBacktrace 获取。