LLM2D

摘要

基于大型语言模型的网络代理的最新进展带来了新的架构和基准，展示了自主网络导航和交互的进步。然而，大多数现有的基准优先考虑有效性和准确性，而忽略了安全性和可信度等关键因素，而这些因素对于在企业环境中部署网络代理至关重要。不安全的网络代理行为的风险，例如意外删除用户帐户或在关键业务操作中执行意外操作，对广泛采用构成了重大障碍。在本文中，我们提出了 ST-WebAgentBench，这是一个新的在线基准，专门用于评估企业环境中网络代理的安全性和可信度。该基准基于一个详细的框架，该框架定义了安全和可信 (ST) 代理的行为，概述了 ST 策略的结构方式，并引入了策略完成度指标来评估代理性能。我们的评估表明，当前的 SOTA 代理难以遵守策略，并且无法用于关键业务应用程序。此外，我们提出了旨在提高网络代理策略意识和合规性的架构原则。我们开源了这个基准，并邀请社区贡献，目标是培养新一代更安全、更可信的 AI 代理。