LLM2D

摘要

arXiv:2504.08525v2 宣告类型: 替换摘要：大规模语言模型（LLMs）越来越多地被用作执行多步任务的自主代理。然而，现有的大多数框架无法维持任务状态的结构化理解，通常依赖于线性提示串联或浅层的记忆缓冲。这导致了脆弱的性能、频繁的幻想和不良的长距离一致性和连贯性。在本文中，我们提出了任务记忆引擎（TME），这是一种轻量级且结构化的记忆模块，通过层次化任务记忆树（TMT）跟踪任务执行。树中的每个节点对应一个任务步骤，存储相关的输入、输出、状态和子任务关系。我们引入了一种提示合成方法，根据活动节点路径动态生成LLM提示，显著提高了执行一致性并增强了上下文关联。通过对多步代理任务的案例研究和比较实验，我们证明了TME能够实现更高的任务完成准确性和更具解释性的行为，且实施开销极小。核心TME组件的基本实现可在 https://github.com/biubiutomato/TME-Agent 查看，包括基本示例和结构化记忆的集成。尽管当前实现使用了基于树的结构，TME被设计为图意识的，支持可复用的子步骤、收敛的任务路径和共享依赖性。这为进一步基于DAG的记忆架构奠定了基础。