摘要
arXiv:2504.11544v1 通知类型: 新
摘要: 检索增强生成 (RAG) 使大规模语言模型能够访问外部和私有语料库,从而在特定领域内实现事实一致的响应。通过利用语料库的固有结构,基于图的 RAG 方法进一步丰富了这一过程,通过构建知识图谱索引并利用图的结构特性。然而,当前基于图的 RAG 方法很少优先考虑图结构的设计。设计不当的图不仅阻碍了各种图算法的无缝集成,而且还导致工作流程不一致性并降低性能。为进一步释放图在 RAG 中的潜力,我们提出了 NodeRAG,这是一种基于图的框架,引入了异质图结构,使图基方法能够无缝且全面地集成到 RAG 工作流中。通过紧密配合 LLM 的能力,该框架确保了端到端流程的一致性和高效性。通过广泛的实验,我们证明了 NodeRAG 在索引时间、查询时间和存储效率方面表现出色,并且在多跳基准和与 LightRAG 和 GraphRAG 进行开放性直接对抗测试时,在最小检索令牌的情况下提供了更优越的问答性能。我们的 GitHub 仓库可在 https://github.com/Terry-Xu-666/NodeRAG 查看。