LLM2D

摘要

arXiv:2505.02502v1 宣布类型: 交叉学科摘要：背景：大型语言模型（LLMs）通过开源和商业框架越来越广泛地部署，使个人和组织能够自行托管高级AI能力。然而，不安全的默认设置和错误配置往往将LLM服务暴露在公共互联网上，提出了重大的安全和系统工程风险。目标：本研究旨在通过一项大规模实证研究揭示野生环境中公共可访问的LLM部署情况，重点关注服务的流行程度、暴露特性、系统漏洞及其相关风险。方法：我们进行了全网测量，以确定15个框架中的公共可访问LLM部署情况，发现320,102个服务。我们提取了158个独特的API端点，并根据功能和安全风险将其分为12个功能性类别。我们进一步分析了配置、认证实践和地理分布，揭示了实际LLM系统工程中的部署趋势和系统问题。结果：我们的研究显示，公共LLM部署正在快速增长但往往是不安全的。在所有端点中，我们观察到使用不安全协议、TLS配置不良和对关键操作的未认证访问的普遍情况。安全风险，包括模型披露、系统泄漏和未经授权的访问，普遍存在，强调了需要默认安全框架和更强的部署实践。结论：公共可访问的LLM部署遭受广泛的安全和配置缺陷，使服务面临滥用、模型窃取、资源劫持和远程利用的风险。加强默认安全设置、部署实践和操作标准对于不断增长的自行托管LLM生态系统至关重要。