LLM2D
Hello 再见!由大规模语言模型驱动的个性化对话代理用于长期对话
Hello Again! LLM-powered Personalized Agent for Long-term Dialogue
作者: Hao Li, Chenghao Yang, An Zhang, Yang Deng, Xiang Wang, Tat-Seng Chua
发布日期: 2/14/2025
arXiv ID: oai:arXiv.org:2406.05925v2

摘要

arXiv:2406.05925v2 宣告类型:替换 摘要:随着大型语言模型(LLMs)的发展,开放域对话系统取得了显著的进步。然而,现有的大多数对话系统主要关注短暂的单会话交互,忽视了长期伴侣和个性化交互的实际需求。解决这一实际需求的关键在于事件总结和人设管理,这使得长期对话生成更为合理。LLMs表现出的人类认知和推理能力的最新进展表明,基于LLM的代理能够显著提升自动感知、决策和问题解决的能力。为了应对这一潜力,我们提出了一种模型无关的框架,即长期对话代理(LD-Agent),该框架包含三个独立可调模块,分别专注于事件感知、人设提取和响应生成。对于事件记忆模块,使用了长短期记忆库,分别关注历史会话和正在进行的会话,同时引入了基于主题的检索机制,以提高记忆检索的准确性。此外,人设模块进行了用户和代理的动态人设建模。随后,提取的记忆和人设被输入到生成器中,以生成合适的响应。LD-Agent的有效性、通用性和跨域能力通过各种示例基准、模型和任务得到了实证展示。源代码发布在 https://github.com/leolee99/LD-Agent。