摘要
arXiv:2504.03767v2 更新类型: 替换-交叉检查
摘要: 为了减少开发成本并使任何形式的生成AI应用程序中的潜在组件能够无缝集成,Model Context Protocol (MCP)(Anthropic, 2024)最近已发布并广泛采用。MCP 是一个开放协议,标准化了对大型语言模型(LLMs)、数据源和代理工具的 API 调用。通过连接多个 MCP 服务器,每台服务器都定义了一组工具、资源和提示,用户可以定义完全由 LLM 驱动的自动化工作流。然而,我们展示了当前 MCP 设计对终端用户存在广泛的的安全风险。特别是,我们证明了行业领先的大型语言模型可能被诱导使用 MCP 工具,通过各种攻击(如恶意代码执行、远程访问控制和凭证窃取)来侵害AI开发者的系统。为了积极缓解这些相关攻击,我们引入了一个安全审计工具 MCPSafetyScanner,这是第一个评估任意 MCP 服务器安全性的代理工具。MCPScanner 使用多个代理:(a)根据 MCP 服务器的工具和资源自动确定对抗样本;(b)根据这些样本搜索相关漏洞和补救措施;(c)生成一份详细记录所有发现的安全报告。我们的研究突显了一般用途代理工作流中严重安全问题,同时也提供了一个主动工具来审核 MCP 服务器的安全性,并在部署前解决检测到的漏洞。
所描述的 MCP 服务器审计工具 MCPSafetyScanner 可在以下网址免费获取:https://github.com/johnhalloran321/mcpSafetyScanner