LLM2D

摘要

arXiv:2503.23895v3 宣告类型: replace-cross 摘要: 检索增强生成 (RAG) 通过从外部来源检索相关文档并将它们融入到上下文中，增强了大型语言模型 (LLMs)。虽然它通过提供事实性文本提高了可靠性，但在上下文长度增长时显著增加了推理成本，并引入了 RAG 幻觉的挑战性问题，主要原因是 LLM 缺乏相应的参数知识。一种有效的解决方案是在测试时增强 LLM 的知识。参数化 RAG (PRAG) 通过将文档嵌入到 LLM 的参数中来进行测试时的知识增强，通过离线训练有效地降低了推理成本。然而，其高昂的训练和存储成本，以及有限的泛化能力，显著限制了其实际应用。为了解决这些挑战，我们提出了动态参数化 RAG (DyPRAG)，这是一种新的框架，利用轻量级的参数翻译模型高效地将文档转换为参数知识。DyPRAG 不仅降低了推理、训练和存储成本，还能动态生成参数知识，无缝增强 LLM 的知识，并在测试时以即插即用的方式解决知识冲突。在多个数据集上的 extensive 实验展示了 DyPRAG 的有效性和泛化能力，提供了一种强大的实用 RAG 架构，能够在实际应用中实现卓越的知识融合并缓解 RAG 幻觉。我们的代码可在 https://github.com/Trae1ounG/DyPRAG 获取。