LLM2D
面向可信检索增强生成的大语言模型:一项综述
Towards Trustworthy Retrieval Augmented Generation for Large Language Models: A Survey
作者: Bo Ni, Zheyuan Liu, Leyao Wang, Yongjia Lei, Yuying Zhao, Xueqi Cheng, Qingkai Zeng, Luna Dong, Yinglong Xia, Krishnaram Kenthapadi, Ryan Rossi, Franck Dernoncourt, Md Mehrab Tanjim, Nesreen Ahmed, Xiaorui Liu, Wenqi Fan, Erik Blasch, Yu Wang, Meng Jiang, Tyler Derr
发布日期: 2/12/2025
arXiv ID: oai:arXiv.org:2502.06872v1

摘要

arXiv:2502.06872v1 类型: cross 摘要: 检索增强生成(RAG)是一种先进的技术,旨在解决人工智能生成内容(AIGC)面临的挑战。通过将上下文检索融入内容生成中,RAG 提供了可靠和最新的外部知识,减少了幻觉,并确保了广泛任务中相关上下文的一致性。然而,尽管 RAG 成功且潜力巨大,近期的研究表明,RAG 架构也引入了新的风险,包括鲁棒性问题、隐私担忧、对抗攻击以及问责制问题。解决这些风险对于未来 RAG 系统的应用至关重要,因为它们直接影响到系统的可信度。虽然已经开发出多种方法来提高 RAG 方法的信任度,但在该主题的研究中缺乏统一的视角和框架。因此,在本文中,我们旨在通过提供一个全面的道路图来解决这一差距,以促进可信赖的 RAG 系统的发展。我们将讨论围绕五个关键视角:可靠性、隐私、安全性、公平性、可解释性和问责制。对于每个视角,我们将介绍一个通用框架和分类学,提供一个结构化的理解当前挑战、评估现有解决方案并识别有前途的未来研究方向的方法。为了促进更广泛的应用和创新,我们还突出了可信的 RAG 系统在下游应用中产生的显著影响。