摘要
arXiv:2410.05779v3 更新类型: 替换-交叉
摘要: 检索增强生成(RAG)系统通过集成外部知识来源来增强大型语言模型(LLMs),从而使生成更准确且与上下文相关的响应,以满足用户需求。然而,现有的RAG系统存在显著的限制,包括依赖于平坦的数据表示和缺乏足够的上下文意识,这可能导致断碎片段的答案,无法捕捉复杂的相互依赖关系。为了解决这些挑战,我们提出了LightRAG,它将图结构融入到文本索引和检索过程中。这个创新框架采用了一种双层检索系统,能够从低层次和高层次的知识发现中全面检索信息。此外,将图结构与向量表示相结合,促进了相关实体及其关系的高效检索,显著提高了响应速度并保持了上下文的相关性。通过增量更新算法,这一能力进一步增强,确保及时整合新数据,使系统能够在快速变化的数据环境中保持有效和响应迅速。广泛的实验验证显示,与现有方法相比,在检索的准确性和效率方面有显著改进。我们已将LightRAG开源,并可在以下链接获取:https://github.com/HKUDS/LightRAG