摘要
arXiv:2502.06872v1 类型: cross
摘要: 检索增强生成(RAG)是一种先进的技术,旨在解决人工智能生成内容(AIGC)面临的挑战。通过将上下文检索融入内容生成中,RAG 提供了可靠和最新的外部知识,减少了幻觉,并确保了广泛任务中相关上下文的一致性。然而,尽管 RAG 成功且潜力巨大,近期的研究表明,RAG 架构也引入了新的风险,包括鲁棒性问题、隐私担忧、对抗攻击以及问责制问题。解决这些风险对于未来 RAG 系统的应用至关重要,因为它们直接影响到系统的可信度。虽然已经开发出多种方法来提高 RAG 方法的信任度,但在该主题的研究中缺乏统一的视角和框架。因此,在本文中,我们旨在通过提供一个全面的道路图来解决这一差距,以促进可信赖的 RAG 系统的发展。我们将讨论围绕五个关键视角:可靠性、隐私、安全性、公平性、可解释性和问责制。对于每个视角,我们将介绍一个通用框架和分类学,提供一个结构化的理解当前挑战、评估现有解决方案并识别有前途的未来研究方向的方法。为了促进更广泛的应用和创新,我们还突出了可信的 RAG 系统在下游应用中产生的显著影响。