摘要
arXiv:2502.01635v1 类型: cross
摘要:领先的AI开发者和初创公司正越来越多地部署自主AI系统,这些系统能够在有限的人类干预下规划和执行复杂的任务。然而,目前尚没有结构化的框架来记录自主系统的技术组件、预期用途和安全功能。为填补这一空白,我们介绍了AI Agent Index,这是首个公开数据库,用于记录当前部署的自主AI系统的信息。对于符合纳入索引标准的每个系统,我们根据公开可用的信息和与开发者的沟通,记录了该系统的组件(例如,基础模型、推理实施、工具使用)、应用领域(例如,计算机使用、软件工程)以及风险管理实践(例如,评估结果、护栏)。我们发现,尽管开发者通常提供了关于自主系统能力及其应用的充足信息,但目前关于安全性和风险管理实践的信息则相对有限。AI Agent Index 可在 https://aiagentindex.mit.edu/ 上在线访问。