LLM2D

摘要

arXiv:2406.05925v2 宣告类型：替换摘要：随着大型语言模型（LLMs）的发展，开放域对话系统取得了显著的进步。然而，现有的大多数对话系统主要关注短暂的单会话交互，忽视了长期伴侣和个性化交互的实际需求。解决这一实际需求的关键在于事件总结和人设管理，这使得长期对话生成更为合理。LLMs表现出的人类认知和推理能力的最新进展表明，基于LLM的代理能够显著提升自动感知、决策和问题解决的能力。为了应对这一潜力，我们提出了一种模型无关的框架，即长期对话代理（LD-Agent），该框架包含三个独立可调模块，分别专注于事件感知、人设提取和响应生成。对于事件记忆模块，使用了长短期记忆库，分别关注历史会话和正在进行的会话，同时引入了基于主题的检索机制，以提高记忆检索的准确性。此外，人设模块进行了用户和代理的动态人设建模。随后，提取的记忆和人设被输入到生成器中，以生成合适的响应。LD-Agent的有效性、通用性和跨域能力通过各种示例基准、模型和任务得到了实证展示。源代码发布在 https://github.com/leolee99/LD-Agent。