LLM2D

摘要

arXiv:2502.01635v1 类型: cross 摘要：领先的AI开发者和初创公司正越来越多地部署自主AI系统，这些系统能够在有限的人类干预下规划和执行复杂的任务。然而，目前尚没有结构化的框架来记录自主系统的技术组件、预期用途和安全功能。为填补这一空白，我们介绍了AI Agent Index，这是首个公开数据库，用于记录当前部署的自主AI系统的信息。对于符合纳入索引标准的每个系统，我们根据公开可用的信息和与开发者的沟通，记录了该系统的组件（例如，基础模型、推理实施、工具使用）、应用领域（例如，计算机使用、软件工程）以及风险管理实践（例如，评估结果、护栏）。我们发现，尽管开发者通常提供了关于自主系统能力及其应用的充足信息，但目前关于安全性和风险管理实践的信息则相对有限。AI Agent Index 可在 https://aiagentindex.mit.edu/ 上在线访问。