LLM2D

摘要

arXiv:2501.09136v3 公告类型: 替换摘要：大型语言模型（LLMs）通过实现类人文本生成和自然语言理解，已经彻底改变了人工智能（AI）。然而，它们对静态训练数据的依赖限制了它们对动态、实时查询的响应能力，导致输出过时或不准确。检索增强生成（RAG）已经作为一种解决方案出现，通过集成实时数据检索来增强LLMs，从而提供上下文相关和最新的响应。尽管有这些潜力，传统RAG系统仍受限于静态工作流程，缺乏为多步推理和复杂任务管理所需的适应性。代理检索增强生成（Agentic RAG）超越了这些局限性，通过将自主AI代理嵌入到RAG流水线中来克服这些限制。这些代理利用代理设计模式中的自我反思、计划、工具使用和多代理协作，动态管理检索策略，逐步细化上下文理解，并根据复杂的任务要求适应工作流程。这种集成使得Agentic RAG系统能够在各种应用中提供无与伦比的灵活性、可扩展性和上下文感知能力。本综述对Agentic RAG进行了全面探索，从其基本原则和RAG范式的演变开始。它详细介绍了Agentic RAG架构的分类，突显了医疗保健、金融和教育等行业中的关键应用，并分析了其实用实施策略。此外，它讨论了在这些系统中扩展方面的问题，确保伦理决策以及在实际应用中优化性能，同时详细介绍了实施Agentic RAG的框架和工具。