LLM2D
面向Web自动化的大模型下一代AI代理:Web代理综述
A Survey of WebAgents: Towards Next-Generation AI Agents for Web Automation with Large Foundation Models
作者: Liangbo Ning, Ziran Liang, Zhuohang Jiang, Haohao Qu, Yujuan Ding, Wenqi Fan, Xiao-yong Wei, Shanru Lin, Hui Liu, Philip S. Yu, Qing Li
发布日期: 4/1/2025
arXiv ID: oai:arXiv.org:2503.23350v1

摘要

arXiv:2503.23350v1 宣告类型: 新 摘要: 随着网络技术的进步,它们显著地改变了人们生活的方方面面。尽管网络的重要性不言而喻,但许多在网络上完成的任务往往是重复性和耗时的,这对人们的整体生活质量产生了负面影响。为了高效地处理这些繁琐的日常任务,最有可能的方法之一是基于人工智能技术(AI技术)推进自主代理,称为AI代理,因为它们可以在没有疲劳或性能下降的情况下连续操作。在网络的背景下,利用被称为WebAgents的AI代理来自动协助人们处理繁琐的日常任务,可以显著提高生产力和效率。最近,包含数十亿参数的大型基础模型(LFMs)展示了类人语言理解与推理能力,并在执行各种复杂任务方面表现出色。这自然引出了一个问题:“大型基础模型能否被利用来开发强大的AI代理,自动处理网络任务,为用户提供重大便利?”为充分利用大型基础模型的潜力,针对根据用户指令完成日常网络任务的WebAgents的设计进行了广泛的研究,显著提高了日常生活的便利性。在本文综述中,我们全面回顾了WebAgents在三个关键方面的现有研究,包括架构、训练和可信度。此外,还探讨了几条具有前景的研究方向,以提供更深入的见解。