LLM2D
螃蟹:在黑盒设置下通过自动生成消耗资源对LLM进行Dos攻击
Crabs: Consuming Resource via Auto-generation for LLM-DoS Attack under Black-box Settings
作者: Yuanhe Zhang, Zhenhong Zhou, Wei Zhang, Xinyue Wang, Xiaojun Jia, Yang Liu, Sen Su
发布日期: 2/19/2025
arXiv ID: oai:arXiv.org:2412.13879v3

摘要

arXiv:2412.13879v3 安全宣告类型: 替换-跨平台 摘要: 大型语言模型(LLMs)在各种任务上表现出色,但仍易受到外部威胁的影响,尤其是大型语言模型服务拒绝攻击(LLM-DoS 攻击)。具体而言,LLM-DoS 攻击旨在耗尽计算资源并阻止服务。然而,现有研究主要集中在白盒攻击上,导致黑盒场景下研究不足。本文中,我们介绍了一种用于黑盒 LLM 的自动生成 LLM-DoS 攻击(AutoDoS 攻击)的自动化算法。AutoDoS 构建了 DoS 攻击树,并扩展节点覆盖范围,以在黑盒条件下实现有效性。通过基于可移植性的迭代优化,AutoDoS 能够在单个提示下应用于不同的模型。此外,我们揭示了嵌入长度特洛伊病毒(Length Trojan)能使 AutoDoS 更有效地绕过现有防御。实验结果显示,AutoDoS 显著将服务响应延迟放大了超过 250 倍,从 GPU 利用率和内存使用量方面来说,导致严重的资源消耗。我们的工作为 LLM-DoS 攻击和安全防御提供了新的视角。我们的代码可在 https://github.com/shuita2333/AutoDoS 获取。