摘要
arXiv:2502.00840v1 宣布类型: cross
摘要: 大型语言模型(LLMs)在各个领域展现了令人瞩目的能力。伴随着LLMs能力的不断提升和部署场景的扩展,由于其庞大的规模以及在著名模型系列(如Llama、Gemma和Mistral)中广泛应用的高级但复杂的激活设计,其部署挑战愈发严峻。这些挑战在资源受限的部署场景中尤为突出,其中缓解推理效率瓶颈变得至关重要。在众多近期的努力中,激活近似已成为追求推理效率的一种有希望的方法,甚至在私人推理等应用中被视为必不可少的方法。尽管激活近似实现了显著的速度提升,且对功能的影响最小,甚至在实际部署中显得合理有效,但其安全性影响仍然是不明确的。在这项工作中,我们通过进行第一次系统性的安全评估,填补了LLM安全性方面的这一关键空白,揭示了在十种安全对齐的LLM上,七种最新的技术在三种流行类别中的安全性能一直下降。