摘要
arXiv:2503.02268v2 宣传类型: 替换
摘要:大型语言模型(LLMs)的最新进展促使开发出了能够与图形用户界面(GUIs)交互的智能LLM代理。这些代理表现出强大的推理和适应能力,能够执行传统上需要预定义规则的复杂任务。然而,LLM代理依赖于逐步推理,这在处理常规任务时往往会导致效率低下。相比之下,传统的基于规则的系统在效率上表现出色,但在适应新场景方面缺乏智能和灵活性。为了解决这一挑战,我们提出了一种新的演化框架,该框架在保持智能和灵活性的同时提高了操作效率。我们的方法采用了一种记忆机制,记录代理的任务执行历史。通过分析这些历史,代理识别重复的操作序列,并进化出高层操作作为快捷方式,替换这些低层操作并提高效率。这使得代理能够专注于需要更复杂推理的任务,同时简化常规操作。在多个基准任务上的实验结果表明,我们的方法在效率和准确性上显著优于现有方法。代码将开源以支持进一步的研究。