LLM2D
自主检索增强生成:自主RAG综述
Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG
作者: Aditi Singh, Abul Ehtesham, Saket Kumar, Tala Talaei Khoei
发布日期: 2/5/2025
arXiv ID: 2501.09136

摘要

arXiv:2501.09136v3 宣告类型: 重置 摘要: 大型语言模型(LLMs)通过实现类人的文本生成和自然语言理解,彻底改变了人工智能(AI)。然而,它们依赖于静态训练数据的局限性限制了其对动态、实时查询的响应能力,导致输出过时或不准确。检索增强生成(RAG)作为一种解决方案涌现出来,通过集成实时数据检索来提升LLMs,提供上下文相关且最新的响应。尽管具有潜力,但传统的RAG系统受限于静态的工作流程,缺乏用于多步推理和复杂任务管理所需的适应性。 自主检索增强生成(Agentic RAG)超越了这些限制,将自主人工智能代理嵌入到RAG管道中。这些代理利用自主设计模式的反思、规划、工具使用和多智能体协作,动态管理检索策略,迭代提高上下文理解,并根据复杂任务要求调整工作流程。这种集成使Agentic RAG系统能够在各种应用中提供无与伦比的灵活性、可扩展性和上下文感知能力。 本综述全面探讨了Agentic RAG,从其基础原则和RAG范式的演变开始。它提供了Agentic RAG架构的详细分类,突出了医疗保健、金融和教育等行业中的关键应用,并探讨了实际实施策略。此外,它还探讨了在这些系统中扩展的挑战、确保伦理决策以及优化实际应用性能的方法,同时提供了关于实现Agentic RAG框架和工具的详细见解。