LLM2D
spill The Beans: 利用CPU缓存侧信道泄露大型语言模型的令牌
Spill The Beans: Exploiting CPU Cache Side-Channels to Leak Tokens from Large Language Models
作者: Andrew Adiletta, Berk Sunar
发布日期: 5/5/2025
arXiv ID: oai:arXiv.org:2505.00817v1

摘要

arXiv:2505.00817v1 Announce Type: cross 摘要:共享硬件资源侧信道攻击越来越威胁着保密性,尤其是在大型语言模型(LLMs)兴起的情况下。本文我们介绍了Spill The Beans,这是一种利用缓存侧信道来泄露由LLM生成的令牌的新方法。通过将攻击过程与受害模型放置在同一硬件上,我们刷新并重新加载嵌入层中的嵌入向量,其中每个令牌对应一个唯一的嵌入向量。在生成令牌时,这会导致在共享的较低级缓存上由我们的攻击可检测到的缓存命中。 一个重大挑战是大型语言模型的巨大尺寸,由于其计算密集型操作的本性,它们会迅速将嵌入向量从缓存中移除。我们通过平衡监控的令牌数量与泄露的信息量来解决这一问题。监控更多的令牌可以增加词汇库泄露的可能性,但会提高缓存命中由于驱逐而被忽略的风险;监控较少的令牌可以提高检测可靠性,但会限制词汇库覆盖范围。 通过广泛的实验,我们演示了通过缓存侧信道从大型语言模型中泄露令牌的可行性。我们的发现揭示了大型语言模型部署中的一个新的脆弱性,这表明即使是复杂模型也容易受到传统侧信道攻击的影响。我们讨论了在大型语言模型服务基础设施中的隐私和安全影响,并提出了减轻此类威胁的考虑。作为概念证明,我们考虑了两种具体的攻击场景:我们的实验表明,在单次监控下,攻击者可以恢复高达80%-90%的高熵API密钥。而对于英文文本,单次监控可以达到40%的恢复率。我们应当指出,该恢复率高度依赖于监控的令牌集,通过针对更专门的输出领域,这些比率可以得到提高。