摘要
arXiv:2411.12643v2 宣布类型: replace-cross
摘要:AI的快速发展导致了更复杂的深度学习模型,这些模型通常作为不透明的“黑箱”运作,其决策过程缺乏透明度。这种不可解释性在高风险应用中尤为棘手,因为理解模型输出至关重要。本文强调了在建立信任、责任和负责任的部署中提高解释性的的重要性。为了解决这些挑战,我们提出了DLBacktrace,这是一种新型且模型无关的技术,旨在为广泛的领域和架构(包括MLPs、CNNs和基于Transformer的LLM模型)提供清晰的决策见解。我们对DLBacktrace进行了全面概述,并将其性能与已建立的解释性方法,如SHAP、LIME和GradCAM进行了基准测试。结果表明,DLBacktrace有效地增强了对各种任务中模型行为的理解。DLBacktrace兼容PyTorch和TensorFlow开发的模型,支持如BERT、ResNet、U-Net以及适用于表格数据的自定义DNN架构。该库已开源,并可在https://github.com/AryaXAI/DLBacktrace 获取。