摘要
arXiv:2504.19413v1 公告类型:交叉
摘要:大规模语言模型(LLMs)在生成上下文一致的响应方面表现出非凡的能力,但它们固定大小的上下文窗口在维持长时间多会话对话中的一致性方面提出了根本性的挑战。我们引入了Mem0,一种可扩展的以内存为中心的架构,通过动态提取、整合和检索正在进行的对话中的重要信息来解决这一问题。在此基础上,我们进一步提出了一种增强的变体,利用基于图的记忆表示来捕获对话元素之间的复杂关系结构。通过在LOCOMO基准上的全面评估,我们系统地将我们的方法与六类基线进行了比较:(i)现有的增强记忆系统,(ii)具有不同片段大小和k值的检索增强生成(RAG),(iii)一种处理整个对话历史的方法,(iv)一种开源的记忆解决方案,(v)一种专有的模型系统,以及(vi)一种专用的记忆管理平台。实验证明,我们的方法在四个问题类别:单跳、时间依赖、多跳和开放领域中,始终优于所有现有的记忆系统。值得注意的是,Mem0在LLM作为法官指标上的相对改进达到了26%,而具备图记忆的Mem0的整体得分比基础配置高出约2%。除了准确性提高外,我们还显著降低了与全上下文方法相比的计算开销。特别是,Mem0达到了95%的较低p95延迟,并节省了超过90%的令牌成本,提供了高级推理能力与实际部署约束之间的良好平衡。我们的研究结果突显了结构化、持久性记忆机制在长期对话连贯性中的关键作用,为更可靠和高效的LLM驱动AI代理铺平了道路。