LLM2D

摘要

arXiv:2503.05050v2 宣告类型: replace-cross 摘要：日益增加的大型语言模型（LLM）的复杂性对它们的透明度和可解释性提出了重大挑战，需要使用可解释的人工智能（XAI）技术来提高可信度和易用性。本研究引入了一个全面的评估框架，其中包括四个新的度量标准，用于评估五种XAI技术在五个LLM和两个下游任务上的有效性。我们使用IMDB电影评论数据集和Tweet情感提取数据集对几种XAI技术（LIME、SHAP、集成梯度、逐层相关性传播（LRP）和注意机制可视化（AMV））进行了评估。评估的重点是四个关键度量标准：人工推理一致（HA）、稳健性、一致性以及对比性。我们的结果显示，LIME在多个LLM和评估指标上持续获得高分，而AMV在稳健性和近乎完美的一致性方面表现尤为出色。LRP在对比性方面表现出色，特别是在更复杂的模型中。我们的发现提供了不同XAI方法的优势和局限性的宝贵见解，为开发和选择适合LLM的适当XAI技术提供了指导。