摘要
arXiv:2504.00125v1 宣告类型: 新
摘要: 大型语言模型(LLMs)为增强可解释人工智能(XAI)提供了一种有希望的方法,通过将其复杂的机器学习输出转换为易于理解的故事,使模型预测更加易于用户理解,并帮助弥合高级模型行为与人类可解释性之间的差距。由于缺乏透明度,先进的AI模型,如最前沿的神经网络和深度学习模型,往往被视为“黑盒”。由于用户无法完全理解模型如何得出结论,用户难以信任AI模型的决策,这导致决策过程不那么有效,问责制降低,以及潜在偏见不明确。在开发可解释的人工智能(XAI)模型以赢得用户信任并提供有关模型生成其输出的方法的见解方面面临着挑战。随着大型语言模型的发展,我们希望通过使用基于人类语言的模型(LLMs)来探索模型解释性的可能性。本文综述了现有关于LLMs在XAI中的应用方法,以及LLM生成的解释的评估技术,讨论了相应的问题和限制,并探讨了实际应用。最后,我们通过强调通过LLMs实现XAI的可解释性、自动化、用户为中心和跨学科方法的重要性来讨论未来的研究方向。