LLM2D

摘要

arXiv:2502.01113v1 交叉类型：公告摘要：检索增强生成（RAG）已被证明在将知识整合到大语言模型（LLMs）中非常有效。然而，传统的RAG在捕捉知识片段之间的复杂关系方面存在困难，限制了它们在需要从多个来源整合知识的复杂推理中的性能。最近，图增强检索增强生成（GraphRAG）构建图结构以明确建模这些关系，从而实现更有效的检索器。然而，其性能仍然受到图结构中噪声和不完整性的影响。为了解决这个问题，我们介绍了GFM-RAG，这是一种用于检索增强生成的新颖图基模型（GFM）。GFM-RAG由一种创新的图神经网络提供动力，该网络可以在图结构上进行推理以捕捉复杂的查询-知识关系。具有800万个参数的GFM在大规模数据集上进行了两阶段训练，包含60个知识图和超过1400万个三元组，以及70万个文档。这使得GFM-RAG在性能和泛化能力方面表现出色，使其成为第一个无需微调即可应用于未见过的数据集的图基模型。在三个多跳问答数据集和七个特定领域的RAG数据集上的广泛实验表明，GFM-RAG在保持高效性和与神经网络规模定律一致的前提下达到了最先进的性能，突显了其进一步改进的潜力。