LLM2D

摘要

arXiv:2504.08525v1 宣布类型: 新摘要: 大型语言模型（LLMs）越来越多地被用作进行多步骤任务的自主代理。然而，大多数现有的框架未能维持任务状态的结构化理解，通常依赖于线性提示串联或浅层记忆缓冲区。这导致了脆弱的表现、频繁的虚构以及糟糕的长程一致性。在本文中，我们提出了一种任务记忆引擎（TME），这是一种轻量级且结构化的记忆模块，利用分层的任务记忆树（TMT）跟踪任务执行。树中的每个节点对应于一个任务步骤，存储相关的输入、输出、状态以及子任务关系。我们引入了一种提示合成方法，该方法根据活动节点路径动态生成LLM提示，显著提高了执行一致性并增强了上下文关联。通过多步骤代理任务的案例研究和比较实验，我们展示了TME在最小的实现开销下能够更好地完成任务并具有更高的可解释性行为。TME的完整实现可在 https://github.com/biubiutomato/TME-Agent 获取。