摘要
arXiv:2406.05925v2 宣告类型:替换
摘要:随着大型语言模型(LLMs)的发展,开放域对话系统取得了显著的进步。然而,现有的大多数对话系统主要关注短暂的单会话交互,忽视了长期伴侣和个性化交互的实际需求。解决这一实际需求的关键在于事件总结和人设管理,这使得长期对话生成更为合理。LLMs表现出的人类认知和推理能力的最新进展表明,基于LLM的代理能够显著提升自动感知、决策和问题解决的能力。为了应对这一潜力,我们提出了一种模型无关的框架,即长期对话代理(LD-Agent),该框架包含三个独立可调模块,分别专注于事件感知、人设提取和响应生成。对于事件记忆模块,使用了长短期记忆库,分别关注历史会话和正在进行的会话,同时引入了基于主题的检索机制,以提高记忆检索的准确性。此外,人设模块进行了用户和代理的动态人设建模。随后,提取的记忆和人设被输入到生成器中,以生成合适的响应。LD-Agent的有效性、通用性和跨域能力通过各种示例基准、模型和任务得到了实证展示。源代码发布在 https://github.com/leolee99/LD-Agent。