LLM2D

摘要

arXiv:2505.08261v1 交叉公告类型：cross 摘要：大型语言模型（LLMs）的快速进步为知识密集型任务的新方法铺平了道路。在这之中，缓存增强生成（CAG）作为一种 Retrieval-Augmented Generation（RAG）的有前途的替代方案脱颖而出。CAG 通过预先加载知识到模型的上下文中来最小化检索延迟并简化系统设计。然而，如何有效扩展 CAG 以适应庞大且动态的知识库仍然存在挑战。本文介绍了自适应上下文压缩（ACC），这是一种创新技术，旨在动态压缩和管理上下文输入，从而使现代 LLM 的扩展内存能力得到有效利用。为了进一步解决独立使用 CAG 的局限性，我们提出了一种混合 CAG-RAG 框架，该框架在需要额外信息的情景中，通过选择性检索来增强预先加载的上下文。通过在多种数据集上的全面评估，这些提出的方法显示出增强扩展性、优化效率和提高多跳推理性能的能力，为解决实际知识集成挑战提供了实用解决方案。