LLM2D

摘要

arXiv:2308.15022v3 公告类型: replace-cross 摘要: 最近，大型语言模型（LLMs），如GPT-4，表现出色的对话能力，使它们能够就广泛的话题进行动态和上下文相关的对话。然而，面对长对话时，这些聊天机器人无法回忆起过去的信息，倾向于生成不一致的响应。为了解决这一问题，我们提出使用大型语言模型（LLMs）递归地生成摘要/记忆以增强长期记忆能力。具体而言，我们的方法首先激发LLMs记住小对话背景，然后使用先前的记忆和后续背景递归地生成新的记忆。最后，在最新记忆的帮助下，聊天机器人可以轻松生成高度一致的响应。我们在开放和封闭系统LMMs上评估了我们的方法，广泛使用的公开数据集的实验表明，我们的方法可以生成更加一致的长期对话响应。此外，我们展示了我们的策略能够很好地补充长期对话（例如，8K和16K）和检索增强的LLMs，带来进一步的长期对话性能。值得注意的是，我们的方法是有潜力使LLM能够建模极其长的上下文。代码和脚本稍后将发布。