LLM2D
受利益相关方委托:在大语言模型时代NLP模型可解释性的发展趋势
On Behalf of the Stakeholders: Trends in NLP Model Interpretability in the Era of LLMs
作者: Nitay Calderon, Roi Reichart
发布日期: 2/5/2025
arXiv ID: 2407.19200

摘要

arXiv:2407.19200v2 类型: replace-cross 摘要:自然语言处理(NLP)系统最近的发展,特别是通过引入大型语言模型(LLMs),导致这些系统被各个领域广泛用户采用,影响了决策、就业市场、社会和科学研究。这种使用量的激增带来了NLP模型解释性和分析研究的爆炸性增长,以及众多的技术综述。然而,这些综述往往忽略了解释利害关系者的需要和视角。在本文中,我们回答了三个基本问题:我们需要解释性的原因是什么,我们解释什么,以及如何解释。通过探讨这些问题,我们检查了现有的解释性范式、其属性及其对不同利害关系者的相关性。我们进一步通过分析过去十年多个研究领域的趋势,探讨了这些范式的实际影响。为此,我们检索了数千篇论文,并使用了LLM来描述它们。我们的分析揭示了NLP开发人员和非开发人员用户之间,以及不同研究领域之间的重大差异,突显了不同利害关系者多样化的需要。例如,在NLP领域之外,很少使用对内部模型组件的解释。我们希望本文能为未来适合各种利害关系者目标和要求的方法的设计、开发和应用提供信息。