LLM2D
AppAgentX:进化为 proficient 智能手机用户的 GUI 代理
AppAgentX: Evolving GUI Agents as Proficient Smartphone Users
作者: Wenjia Jiang, Yangyang Zhuang, Chenxi Song, Xu Yang, Joey Tianyi Zhou, Chi Zhang
发布日期: 4/16/2025
arXiv ID: oai:arXiv.org:2503.02268v3

摘要

arXiv:2503.02268v3 宣告类型: 更新 摘要:近年来,大型语言模型(LLMs)的进步促进了能够与图形用户界面(GUIs)交互的智能化LLM代理的发展。这些代理展示了强大的推理能力和适应性,能够执行传统上需要预定义规则才能完成的复杂任务。然而,LLM代理依赖于逐步骤推理往往会导致对常规任务的低效处理。相比之下,传统的基于规则的系统在效率上表现出色,但在应对新情况时缺乏智能性和灵活性。为了应对这一挑战,我们提出了一种新的进化框架,该框架在提高操作效率的同时保持了智能性和灵活性。我们的方法结合了一个记忆机制,记录代理的任务执行历史。通过分析这段历史,代理识别重复的操作序列,并进化出高层操作,这些高层操作作为捷径来取代低层操作,从而提高效率。这使得代理能够专注于需要更复杂推理的任务,而将常规操作简化。实验结果表明,在多个基准任务上,我们的方法在效率和准确性方面显著优于现有方法。我们将开放源代码以支持进一步的研究。