LLM2D

摘要

arXiv:2411.12643v2 宣告类型: replace-cross 摘要：AI 的迅速发展导致了更复杂的深度学习模型，这些模型常常以“黑盒”方式运作，对其决策过程的透明度有限。这种解释性不足在高风险应用场景中尤其构成挑战，因为理解模型输出变得至关重要。本工作突显了可解释性在培养信任、可问责性和负责任部署方面的重要性。为应对这些挑战，我们引入了 DLBacktrace，这是一种新型的、面向所有模型的技术，旨在为不同领域和架构（包括MLP、CNN 和基于Transformer的大语言模型）的深度学习模型决策提供清晰的洞察。我们全面介绍了DLBacktrace，并将其性能与已经建立的可解释性方法（如SHAP、LIME和GradCAM）进行了基准测试。我们的结果显示，DLBacktrace能有效地增强对各种任务中模型行为的理解。DLBacktrace与PyTorch和TensorFlow开发的模型兼容，支持如BERT、ResNet、U-Net和自定义的表格数据DNN等架构。该库已开源，可在 https://github.com/AryaXAI/DLBacktrace 获取。