LLM2D

摘要

arXiv:2503.02268v2 宣传类型: 替换摘要：大型语言模型（LLMs）的最新进展促使开发出了能够与图形用户界面（GUIs）交互的智能LLM代理。这些代理表现出强大的推理和适应能力，能够执行传统上需要预定义规则的复杂任务。然而，LLM代理依赖于逐步推理，这在处理常规任务时往往会导致效率低下。相比之下，传统的基于规则的系统在效率上表现出色，但在适应新场景方面缺乏智能和灵活性。为了解决这一挑战，我们提出了一种新的演化框架，该框架在保持智能和灵活性的同时提高了操作效率。我们的方法采用了一种记忆机制，记录代理的任务执行历史。通过分析这些历史，代理识别重复的操作序列，并进化出高层操作作为快捷方式，替换这些低层操作并提高效率。这使得代理能够专注于需要更复杂推理的任务，同时简化常规操作。在多个基准任务上的实验结果表明，我们的方法在效率和准确性上显著优于现有方法。代码将开源以支持进一步的研究。