LLM2D

摘要

arXiv:2504.03767v2 更新类型: 替换-交叉检查摘要: 为了减少开发成本并使任何形式的生成AI应用程序中的潜在组件能够无缝集成，Model Context Protocol (MCP)（Anthropic, 2024）最近已发布并广泛采用。MCP 是一个开放协议，标准化了对大型语言模型（LLMs）、数据源和代理工具的 API 调用。通过连接多个 MCP 服务器，每台服务器都定义了一组工具、资源和提示，用户可以定义完全由 LLM 驱动的自动化工作流。然而，我们展示了当前 MCP 设计对终端用户存在广泛的的安全风险。特别是，我们证明了行业领先的大型语言模型可能被诱导使用 MCP 工具，通过各种攻击（如恶意代码执行、远程访问控制和凭证窃取）来侵害AI开发者的系统。为了积极缓解这些相关攻击，我们引入了一个安全审计工具 MCPSafetyScanner，这是第一个评估任意 MCP 服务器安全性的代理工具。MCPScanner 使用多个代理：（a）根据 MCP 服务器的工具和资源自动确定对抗样本；（b）根据这些样本搜索相关漏洞和补救措施；（c）生成一份详细记录所有发现的安全报告。我们的研究突显了一般用途代理工作流中严重安全问题，同时也提供了一个主动工具来审核 MCP 服务器的安全性，并在部署前解决检测到的漏洞。所描述的 MCP 服务器审计工具 MCPSafetyScanner 可在以下网址免费获取：https://github.com/johnhalloran321/mcpSafetyScanner