摘要
arXiv:2504.08525v2 宣告类型: 替换
摘要:大规模语言模型(LLMs)越来越多地被用作执行多步任务的自主代理。然而,现有的大多数框架无法维持任务状态的结构化理解,通常依赖于线性提示串联或浅层的记忆缓冲。这导致了脆弱的性能、频繁的幻想和不良的长距离一致性和连贯性。在本文中,我们提出了任务记忆引擎(TME),这是一种轻量级且结构化的记忆模块,通过层次化任务记忆树(TMT)跟踪任务执行。树中的每个节点对应一个任务步骤,存储相关的输入、输出、状态和子任务关系。我们引入了一种提示合成方法,根据活动节点路径动态生成LLM提示,显著提高了执行一致性并增强了上下文关联。通过对多步代理任务的案例研究和比较实验,我们证明了TME能够实现更高的任务完成准确性和更具解释性的行为,且实施开销极小。核心TME组件的基本实现可在 https://github.com/biubiutomato/TME-Agent 查看,包括基本示例和结构化记忆的集成。尽管当前实现使用了基于树的结构,TME被设计为图意识的,支持可复用的子步骤、收敛的任务路径和共享依赖性。这为进一步基于DAG的记忆架构奠定了基础。