LLM2D
无需延迟的RAG:检索增强生成管道的交互式调试
RAG Without the Lag: Interactive Debugging for Retrieval-Augmented Generation Pipelines
作者: Quentin Romero Lauro, Shreya Shankar, Sepanta Zeighami, Aditya Parameswaran
发布日期: 4/21/2025
arXiv ID: oai:arXiv.org:2504.13587v1

摘要

arXiv:2504.13587v1 宣布类型:跨学科 摘要:检索增强生成(RAG)管道已成为构建具有外部领域特定知识访问权限的AI助手的默认方法。给定一个用户查询,RAG管道通常首先从外部来源检索(R)相关的信息,然后调用一个增强(A)了这些信息的大型语言模型(LLM)来进行(G)响应生成。现代RAG管道经常以任意顺序链接多个检索和生成组件。然而,开发有效的RAG管道具有挑战性,因为检索和生成组件是相互交织的,这使得很难确定哪些组件在最终输出中导致了错误。参数对输出质量的最直接影响通常需要在每次更改后进行数小时的预处理,从而创建了无法接受的缓慢反馈循环。为了解决这些挑战,我们提出了RAGGY,这是一种集成了可组合RAG基础构件的Python库和实时调试交互界面的开发者工具。我们贡献了RAGGY的设计和实现,通过对12名工程师进行定性研究获得的专家调试模式的见解,以及对未来更好地符合开发人员自然工作流程的RAG工具的设计含义。