LLM2D
一个综合框架及其新型指标,用于评估XAI技术在LLM中的有效性
A Unified Framework with Novel Metrics for Evaluating the Effectiveness of XAI Techniques in LLMs
作者: Melkamu Abay Mersha, Mesay Gemeda Yigezu, Hassan Shakil, Ali K. AlShami, Sanghyun Byun, Jugal Kalita
发布日期: 4/9/2025
arXiv ID: oai:arXiv.org:2503.05050v2

摘要

arXiv:2503.05050v2 宣告类型: replace-cross 摘要:日益增加的大型语言模型(LLM)的复杂性对它们的透明度和可解释性提出了重大挑战,需要使用可解释的人工智能(XAI)技术来提高可信度和易用性。本研究引入了一个全面的评估框架,其中包括四个新的度量标准,用于评估五种XAI技术在五个LLM和两个下游任务上的有效性。我们使用IMDB电影评论数据集和Tweet情感提取数据集对几种XAI技术(LIME、SHAP、集成梯度、逐层相关性传播(LRP)和注意机制可视化(AMV))进行了评估。评估的重点是四个关键度量标准:人工推理一致(HA)、稳健性、一致性以及对比性。我们的结果显示,LIME在多个LLM和评估指标上持续获得高分,而AMV在稳健性和近乎完美的一致性方面表现尤为出色。LRP在对比性方面表现出色,特别是在更复杂的模型中。我们的发现提供了不同XAI方法的优势和局限性的宝贵见解,为开发和选择适合LLM的适当XAI技术提供了指导。