摘要
arXiv:2504.12682v1 宣告类型: 新颖
摘要: 最近的网络代理研究主要集中在导航和交易任务上,对大规模提取结构化数据的关注较少。本文介绍了WebLists,这是一个针对四个常见商务和企业用例的200个数据提取任务基准。每个任务都需要代理导航到网页,对其进行适当配置,并提取具有明确模式的完整数据集。我们展示了在问答任务上表现更好的LLM搜索代理和最新网页代理在这类任务上的召回率分别为3%和31%。
为应对这一挑战,本文提出了一种名为BardeenAgent的新颖框架,该框架使网络代理能够将其执行转换为可重复的程序,并在具有相似结构的页面上大规模重放。BardeenAgent也是首款利用HTML规律结构的LLM代理。具体而言,BardeenAgent构建了一个可泛化的CSS选择器,以捕获页面上的所有相关信息,然后调整操作以提取数据。
在WebLists基准上,BardeenAgent的总体召回率为66%,超过翻倍了最新网页代理的表现,并将每行输出的成本降低了3倍。