摘要
arXiv:2412.13879v3 安全宣告类型: 替换-跨平台
摘要: 大型语言模型(LLMs)在各种任务上表现出色,但仍易受到外部威胁的影响,尤其是大型语言模型服务拒绝攻击(LLM-DoS 攻击)。具体而言,LLM-DoS 攻击旨在耗尽计算资源并阻止服务。然而,现有研究主要集中在白盒攻击上,导致黑盒场景下研究不足。本文中,我们介绍了一种用于黑盒 LLM 的自动生成 LLM-DoS 攻击(AutoDoS 攻击)的自动化算法。AutoDoS 构建了 DoS 攻击树,并扩展节点覆盖范围,以在黑盒条件下实现有效性。通过基于可移植性的迭代优化,AutoDoS 能够在单个提示下应用于不同的模型。此外,我们揭示了嵌入长度特洛伊病毒(Length Trojan)能使 AutoDoS 更有效地绕过现有防御。实验结果显示,AutoDoS 显著将服务响应延迟放大了超过 250 倍,从 GPU 利用率和内存使用量方面来说,导致严重的资源消耗。我们的工作为 LLM-DoS 攻击和安全防御提供了新的视角。我们的代码可在 https://github.com/shuita2333/AutoDoS 获取。