LLM2D
开放式RAG:基于开源大型语言模型的增强检索增强推理
Open-RAG: Enhanced Retrieval-Augmented Reasoning with Open-Source Large Language Models
作者: Shayekh Bin Islam, Md Asib Rahman, K S M Tozammel Hossain, Enamul Hoque, Shafiq Joty, Md Rizwan Parvez
发布日期: 10/3/2024
arXiv ID: oai:arXiv.org:2410.01782v1

摘要

检索增强生成(RAG)已被证明可以提高大型语言模型(LLM)的事实准确性,但现有方法在有效利用检索到的证据方面往往推理能力有限,尤其是在使用开源 LLM 时。为了弥合这一差距,我们引入了一个新框架 Open-RAG,旨在通过开源 LLM 增强 RAG 中的推理能力。我们的框架将任意密集 LLM 转化为参数高效的稀疏专家混合(MoE)模型,能够处理复杂的推理任务,包括单跳和多跳查询。Open-RAG 独特地训练模型来应对看似相关但具有误导性的挑战性干扰因素。因此,Open-RAG 利用潜在学习,动态选择相关专家并有效地整合外部知识,以获得更准确和上下文相关的响应。此外,我们提出了一种混合自适应检索方法来确定检索必要性,并在性能提升和推理速度之间取得平衡。实验结果表明,基于 Llama2-7B 的 Open-RAG 在各种知识密集型任务中优于最先进的 LLM 和 RAG 模型,例如 ChatGPT、Self-RAG 和 Command R+。我们将在 https://openragmoe.github.io/ 上开源我们的代码和模型。