LLM2D

摘要

arXiv:2412.13879v3 安全宣告类型: 替换-跨平台摘要: 大型语言模型(LLMs)在各种任务上表现出色，但仍易受到外部威胁的影响，尤其是大型语言模型服务拒绝攻击（LLM-DoS 攻击）。具体而言，LLM-DoS 攻击旨在耗尽计算资源并阻止服务。然而，现有研究主要集中在白盒攻击上，导致黑盒场景下研究不足。本文中，我们介绍了一种用于黑盒 LLM 的自动生成 LLM-DoS 攻击（AutoDoS 攻击）的自动化算法。AutoDoS 构建了 DoS 攻击树，并扩展节点覆盖范围，以在黑盒条件下实现有效性。通过基于可移植性的迭代优化，AutoDoS 能够在单个提示下应用于不同的模型。此外，我们揭示了嵌入长度特洛伊病毒（Length Trojan）能使 AutoDoS 更有效地绕过现有防御。实验结果显示，AutoDoS 显著将服务响应延迟放大了超过 250 倍，从 GPU 利用率和内存使用量方面来说，导致严重的资源消耗。我们的工作为 LLM-DoS 攻击和安全防御提供了新的视角。我们的代码可在 https://github.com/shuita2333/AutoDoS 获取。