LLM2D

摘要

arXiv:2504.15585v1 安全类型: 横跨摘要：大型语言模型（LLMs）的非凡成功照亮了通往实现人工通用智能的有希望的道路，这对学术界和工业界都充满了前景，这得益于它们在各种应用中前所未有的性能。随着LLMs在研究和商业领域中的重要性不断增加，其安全和安全性问题引起了广泛关注，不仅对研究者和企业，也对每一个国家来说都是如此。目前，现有对LLM安全性的调查主要集中在LLM生命周期的特定阶段，如部署阶段或微调阶段，缺乏对整个“生命链”的全面理解。为了填补这一空白，本文首次提出了“全栈”安全的概念，系统地考虑了从LLM训练到部署直至最终商业化过程中的安全问题。与现有的现成的LLM安全性调查相比，我们的工作展示了几个显著的优势：（I）全面视角。我们将完整的LLM生命周期定义为涵盖数据准备、预训练、后训练、部署和最终商业化。据我们所知，这是首次涵盖整个LLM生命周期的安全调查。（II）广泛的文献支持。我们的研究基于对超过800多篇论文的详尽回顾，确保了全面覆盖和系统的组织，从更整体的角度理解安全问题。（III）独特的见解。通过系统性的文献分析，我们为每一章发展出了可靠的道路图和视角。我们的工作确定了一些有前途的研究方向，包括数据生成中的安全性、对齐技术、模型编辑以及基于LLM的代理系统。这些见解为研究人员在未来在这个领域的研究提供了宝贵的指导。