LLM2D

摘要

arXiv:2501.09136v2 公告类型:替换摘要：大型语言模型（LLMs）通过实现类人的文本生成和自然语言理解，推动了人工智能（AI）的发展。然而，它们依赖于静态训练数据，限制了它们对动态、实时查询的响应能力，导致输出过时或不准确。检索增强生成（RAG）作为一种解决方案出现，通过集成实时数据检索来增强LLMs，提供上下文相关且最新的响应。尽管其潜力巨大，但传统的RAG系统受到静态工作流程的限制，缺乏多步推理和复杂任务管理所需的适应性。自主检索增强生成（Agentic RAG）超越了这些限制，通过将自主AI代理嵌入到RAG流水线中。这些代理利用自主设计模式中的反思、计划、工具使用和多代理协作，动态管理检索策略，迭代完善上下文理解，并适应流程以满足复杂的任务要求。这种整合使Agentic RAG系统在各种应用程序中实现了无与伦比的灵活性、可扩展性和上下文感知能力。本文综述对Agentic RAG进行了全面探讨，从其基础原理和RAG范式的演变入手。它详细介绍了Agentic RAG架构的分层，突出了在医疗保健、金融和教育等行业中的关键应用，并探讨了实用实施策略。此外，它还探讨了在扩展这些系统时遇到的挑战，确保伦理决策，并在实际应用中优化性能，提供实施Agentic RAG的框架和工具的详细见解。