LLM2D
MacRAG: 压缩、切片并放大以实现多尺度自适应上下文RAG
MacRAG: Compress, Slice, and Scale-up for Multi-Scale Adaptive Context RAG
作者: Woosang Lim, Zekun Li, Gyuwan Kim, Sungyoung Ji, HyeonJung Kim, Kyuri Choi, Jin Hyuk Lim, Kyungpyo Park, William Yang Wang
发布日期: 5/13/2025
arXiv ID: oai:arXiv.org:2505.06569v1

摘要

arXiv:2505.06569v1 交叉通知类型 摘要:长上下文(LC)大规模语言模型(LLMs)与检索增强生成(RAG)组合,在复杂多跳和大规模文档任务中具有很强的潜力。然而,现有的RAG系统经常面临检索不精确、在受限上下文窗口中上下文覆盖不完整以及由于次优上下文构建导致的信息碎片化等问题。我们引入了多尺度自适应上下文RAG(MacRAG),这是一种分层检索框架,将文档压缩和分区为从粗到细的不同粒度,然后通过文档级和分块级的实时扩展,自适应地合并相关上下文。通过从最精细的检索开始,并逐步引入更高层次和更广泛的上下文,MacRAG 构建了有效的查询特定长上下文,优化了精确度和覆盖范围。在具有挑战性的LongBench对HotpotQA、2WikiMultihopQA和Musique的扩展评估中,MacRAG 在单步和多步生成中始终超越了基于Llama-3.1-8B、Gemini-1.5-pro和GPT-4o的基本RAG流水线。我们的结果确立了MacRAG作为一个高效的、可扩展的解决现实世界长上下文、多跳推理问题的方案。我们的代码可在https://github.com/Leezekun/MacRAG上获取。