LLM2D
网页代理综述:面向基于大规模基础模型的下一代网络自动化AI代理
A Survey of WebAgents: Towards Next-Generation AI Agents for Web Automation with Large Foundation Models
作者: Liangbo Ning, Ziran Liang, Zhuohang Jiang, Haohao Qu, Yujuan Ding, Wenqi Fan, Xiao-yong Wei, Shanru Lin, Hui Liu, Philip S. Yu, Qing Li
发布日期: 5/13/2025
arXiv ID: oai:arXiv.org:2503.23350v2

摘要

arXiv:2503.23350v2 更新类型: 替换 摘要:随着网络技术的进步,它们已经显著地改变了人们生活的各个方面。尽管网络的重要性不言而喻,但其中许多任务是重复性和耗时的,对整体生活质量产生负面影响。为了高效处理这些日常琐事,最有可能的方法之一是利用人工智能(AI)技术来推进自主代理,被称为AI代理,因为它们可以在疲劳或性能下降的情况下连续运行。在网络的背景下,利用被称为Web_agents的AI代理自动帮助人们处理日常琐事可以显著提高生产力和效率。最近,包含数十亿参数的大型基础模型(LFMs)展示了人类般的语言理解和推理能力,显示出在完成各种复杂任务方面的熟练度。这自然引发了这样的问题:`大型基础模型能否被利用来开发强大的AI代理来自动处理网络任务,为用户提供显著的便利?`为了充分探索大型基础模型的潜力,针对根据用户指令完成日常网络任务的Web_agents研究出现了广泛的研究,显著增强了日常生活的便利性。在这篇综述中,我们全面回顾了Web_agents在三个方面已经存在的研究:架构、训练和可信度。此外,还探讨了对未来研究的一些有希望的方向,以提供更深入的见解。