LLM2D
大型语言模型 (LLM) 的推理能力,RAG 能帮多少?
How Much Can RAG Help the Reasoning of LLM?
作者: Jingyu Liu, Jiaen Lin, Yong Liu
发布日期: 10/4/2024
arXiv ID: oai:arXiv.org:2410.02338v1

摘要

检索增强生成 (RAG) 在现代大型语言模型 (LLM) 中获得了极大的普及,因为它在引入新知识和减少幻觉方面非常有效。然而,人们对 RAG 的深刻理解仍然有限,RAG 如何帮助推理过程以及 RAG 是否可以帮助提高推理能力仍然是一个问题。虽然外部文档通常被认为是整合特定领域信息的一种方法,但它们也包含与查询相关的中间推理结果,这表明文档可以增强 LLM 的推理能力,这在以前从未被探索过。在本文中,我们深入研究了这个问题,发现虽然 RAG 可以帮助推理,但帮助有限。如果我们将推理过程概念化为一个固定深度的树,那么 RAG 难以帮助 LLM 进行更深层次的推理。此外,文档中的信息需要预处理以过滤掉噪声。我们证明,这种预处理很难仅仅通过微调 LLM 来实现,它通常需要许多额外的 Transformer 层来解决问题。为了简化问题,我们提出了 DPrompt 调优,它可以有效地解决问题,只需有限的 Transformer 层,从而提高性能。