LLM2D

摘要

arXiv:2411.12643v2 宣布类型: replace-cross 摘要：AI的快速发展导致了更复杂的深度学习模型，这些模型通常作为不透明的“黑箱”运作，其决策过程缺乏透明度。这种不可解释性在高风险应用中尤为棘手，因为理解模型输出至关重要。本文强调了在建立信任、责任和负责任的部署中提高解释性的的重要性。为了解决这些挑战，我们提出了DLBacktrace，这是一种新型且模型无关的技术，旨在为广泛的领域和架构（包括MLPs、CNNs和基于Transformer的LLM模型）提供清晰的决策见解。我们对DLBacktrace进行了全面概述，并将其性能与已建立的解释性方法，如SHAP、LIME和GradCAM进行了基准测试。结果表明，DLBacktrace有效地增强了对各种任务中模型行为的理解。DLBacktrace兼容PyTorch和TensorFlow开发的模型，支持如BERT、ResNet、U-Net以及适用于表格数据的自定义DNN架构。该库已开源，并可在https://github.com/AryaXAI/DLBacktrace 获取。