LLM2D
可解释人工智能中的隐私风险与保存方法:一项范围性评审
Privacy Risks and Preservation Methods in Explainable Artificial Intelligence: A Scoping Review
作者: Sonal Allana, Mohan Kankanhalli, Rozita Dara
发布日期: 5/6/2025
arXiv ID: oai:arXiv.org:2505.02828v1

摘要

arXiv:2505.02828v1 宣布类型: 新闻 摘要: 可解释的人工智能(XAI)已成为可信赖人工智能的核心支柱,并旨在为天生不透明的复杂模型带来透明度。尽管在模型中整合解释带来了诸多益处,但提供这些额外信息给最终用户时的隐私担忧问题迫在眉睫。本文通过范围审查现有的文献来探讨隐私与可解释性之间的冲突细节。利用范围审查的标准方法,从2019年1月到2024年12月发布的1,943项研究中提取了57篇文章。该审查提出了3个研究问题,以便读者更好地了解这一话题:(1)在人工智能系统中发布解释的隐私风险是什么?(2)研究人员目前采用了哪些方法来实现XAI系统的隐私保护?(3)什么是隐私保护的解释?基于从选定的研究中综合的知识,我们对XAI中的隐私风险和保护方法进行了分类,并提出了隐私保护解释的特征,以帮助研究人员和实践者理解符合隐私要求的XAI的需求。最后,我们指出了在平衡隐私与其他系统需求时面临的挑战,并提供了实现隐私保护XAI的建议。我们期望这篇综述能够揭示隐私与解释性之间的复杂关系,这两者都是可信赖人工智能的基本原则。