LLM2D

摘要

arXiv:2502.00840v1 宣布类型: cross 摘要: 大型语言模型（LLMs）在各个领域展现了令人瞩目的能力。伴随着LLMs能力的不断提升和部署场景的扩展，由于其庞大的规模以及在著名模型系列（如Llama、Gemma和Mistral）中广泛应用的高级但复杂的激活设计，其部署挑战愈发严峻。这些挑战在资源受限的部署场景中尤为突出，其中缓解推理效率瓶颈变得至关重要。在众多近期的努力中，激活近似已成为追求推理效率的一种有希望的方法，甚至在私人推理等应用中被视为必不可少的方法。尽管激活近似实现了显著的速度提升，且对功能的影响最小，甚至在实际部署中显得合理有效，但其安全性影响仍然是不明确的。在这项工作中，我们通过进行第一次系统性的安全评估，填补了LLM安全性方面的这一关键空白，揭示了在十种安全对齐的LLM上，七种最新的技术在三种流行类别中的安全性能一直下降。