LLM2D
揭示野生环境中大语言模型部署的景观:一项实证研究
Unveiling the Landscape of LLM Deployment in the Wild: An Empirical Study
作者: Xinyi Hou, Jiahao Han, Yanjie Zhao, Haoyu Wang
发布日期: 5/6/2025
arXiv ID: oai:arXiv.org:2505.02502v1

摘要

arXiv:2505.02502v1 宣布类型: 交叉学科 摘要:背景:大型语言模型(LLMs)通过开源和商业框架越来越广泛地部署,使个人和组织能够自行托管高级AI能力。然而,不安全的默认设置和错误配置往往将LLM服务暴露在公共互联网上,提出了重大的安全和系统工程风险。目标:本研究旨在通过一项大规模实证研究揭示野生环境中公共可访问的LLM部署情况,重点关注服务的流行程度、暴露特性、系统漏洞及其相关风险。方法:我们进行了全网测量,以确定15个框架中的公共可访问LLM部署情况,发现320,102个服务。我们提取了158个独特的API端点,并根据功能和安全风险将其分为12个功能性类别。我们进一步分析了配置、认证实践和地理分布,揭示了实际LLM系统工程中的部署趋势和系统问题。结果:我们的研究显示,公共LLM部署正在快速增长但往往是不安全的。在所有端点中,我们观察到使用不安全协议、TLS配置不良和对关键操作的未认证访问的普遍情况。安全风险,包括模型披露、系统泄漏和未经授权的访问,普遍存在,强调了需要默认安全框架和更强的部署实践。结论:公共可访问的LLM部署遭受广泛的安全和配置缺陷,使服务面临滥用、模型窃取、资源劫持和远程利用的风险。加强默认安全设置、部署实践和操作标准对于不断增长的自行托管LLM生态系统至关重要。