LLM2D
自主检索增强生成:有关自主RAG的方法综述
Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG
作者: Aditi Singh, Abul Ehtesham, Saket Kumar, Tala Talaei Khoei
发布日期: 2/4/2025
arXiv ID: oai:arXiv.org:2501.09136v2

摘要

arXiv:2501.09136v2 公告类型:替换 摘要:大型语言模型(LLMs)通过实现类人的文本生成和自然语言理解,推动了人工智能(AI)的发展。然而,它们依赖于静态训练数据,限制了它们对动态、实时查询的响应能力,导致输出过时或不准确。检索增强生成(RAG)作为一种解决方案出现,通过集成实时数据检索来增强LLMs,提供上下文相关且最新的响应。尽管其潜力巨大,但传统的RAG系统受到静态工作流程的限制,缺乏多步推理和复杂任务管理所需的适应性。 自主检索增强生成(Agentic RAG)超越了这些限制,通过将自主AI代理嵌入到RAG流水线中。这些代理利用自主设计模式中的反思、计划、工具使用和多代理协作,动态管理检索策略,迭代完善上下文理解,并适应流程以满足复杂的任务要求。这种整合使Agentic RAG系统在各种应用程序中实现了无与伦比的灵活性、可扩展性和上下文感知能力。 本文综述对Agentic RAG进行了全面探讨,从其基础原理和RAG范式的演变入手。它详细介绍了Agentic RAG架构的分层,突出了在医疗保健、金融和教育等行业中的关键应用,并探讨了实用实施策略。此外,它还探讨了在扩展这些系统时遇到的挑战,确保伦理决策,并在实际应用中优化性能,提供实施Agentic RAG的框架和工具的详细见解。