摘要
检索增强生成(RAG)系统通过整合外部知识源来增强大型语言模型(LLM),从而能够根据用户需求提供更准确、更符合语境的响应。然而,现有的 RAG 系统存在重大局限性,包括依赖于平面数据表示以及缺乏足够的上下文意识,这会导致答案支离破碎,无法捕捉复杂的相互依赖关系。为了解决这些挑战,我们提出了 LightRAG,它将图结构融入文本索引和检索过程。这个创新的框架采用了一个双层检索系统,从低级和高级知识发现中增强了全面的信息检索。此外,图结构与向量表示的集成促进了相关实体及其关系的有效检索,显著提高了响应时间,同时保持了上下文相关性。这种能力通过增量更新算法得到进一步增强,该算法确保及时整合新数据,使系统能够在快速变化的数据环境中保持有效性和响应能力。大量的实验验证表明,与现有方法相比,检索精度和效率都有了显著提高。我们已将 LightRAG 开源,可在以下链接获得:https://github.com/HKUDS/LightRAG。