LLM2D

摘要

arXiv:2503.23350v1 宣告类型: 新摘要: 随着网络技术的进步，它们显著地改变了人们生活的方方面面。尽管网络的重要性不言而喻，但许多在网络上完成的任务往往是重复性和耗时的，这对人们的整体生活质量产生了负面影响。为了高效地处理这些繁琐的日常任务，最有可能的方法之一是基于人工智能技术（AI技术）推进自主代理，称为AI代理，因为它们可以在没有疲劳或性能下降的情况下连续操作。在网络的背景下，利用被称为WebAgents的AI代理来自动协助人们处理繁琐的日常任务，可以显著提高生产力和效率。最近，包含数十亿参数的大型基础模型（LFMs）展示了类人语言理解与推理能力，并在执行各种复杂任务方面表现出色。这自然引出了一个问题：“大型基础模型能否被利用来开发强大的AI代理，自动处理网络任务，为用户提供重大便利？”为充分利用大型基础模型的潜力，针对根据用户指令完成日常网络任务的WebAgents的设计进行了广泛的研究，显著提高了日常生活的便利性。在本文综述中，我们全面回顾了WebAgents在三个关键方面的现有研究，包括架构、训练和可信度。此外，还探讨了几条具有前景的研究方向，以提供更深入的见解。