LLM2D

摘要

arXiv:2502.01142v1 宣布类型: new 摘要: 大型语言模型（LLMs）在推理方面表现出色，但由于参数知识的时间性、准确性和覆盖面，它们仍然会遭受严重的事实幻觉。同时，将推理与检索增强生成（RAG）集成仍然具有挑战性，因为任务分解不有效和检索冗余可能导致引入噪声并降低响应质量。本文提出了一种名为DeepRAG的框架，将检索增强推理建模为马尔可夫决策过程（MDP），从而实现战略性且适应性的检索。通过迭代分解查询，DeepRAG在每一步动态决定是检索外部知识还是依赖于参数推理。实验结果表明，DeepRAG在提高检索效率的同时，回答准确性提高了21.99%，证明了其在优化检索增强推理方面的有效性。