摘要
arXiv:2504.15585v1 安全类型: 横跨
摘要:大型语言模型(LLMs)的非凡成功照亮了通往实现人工通用智能的有希望的道路,这对学术界和工业界都充满了前景,这得益于它们在各种应用中前所未有的性能。随着LLMs在研究和商业领域中的重要性不断增加,其安全和安全性问题引起了广泛关注,不仅对研究者和企业,也对每一个国家来说都是如此。目前,现有对LLM安全性的调查主要集中在LLM生命周期的特定阶段,如部署阶段或微调阶段,缺乏对整个“生命链”的全面理解。为了填补这一空白,本文首次提出了“全栈”安全的概念,系统地考虑了从LLM训练到部署直至最终商业化过程中的安全问题。与现有的现成的LLM安全性调查相比,我们的工作展示了几个显著的优势:(I)全面视角。我们将完整的LLM生命周期定义为涵盖数据准备、预训练、后训练、部署和最终商业化。据我们所知,这是首次涵盖整个LLM生命周期的安全调查。(II)广泛的文献支持。我们的研究基于对超过800多篇论文的详尽回顾,确保了全面覆盖和系统的组织,从更整体的角度理解安全问题。(III)独特的见解。通过系统性的文献分析,我们为每一章发展出了可靠的道路图和视角。我们的工作确定了一些有前途的研究方向,包括数据生成中的安全性、对齐技术、模型编辑以及基于LLM的代理系统。这些见解为研究人员在未来在这个领域的研究提供了宝贵的指导。