LLM2D
LLM(-Agent)全栈安全性综述:数据、训练与部署
A Comprehensive Survey in LLM(-Agent) Full Stack Safety: Data, Training and Deployment
作者: Kun Wang, Guibin Zhang, Zhenhong Zhou, Jiahao Wu, Miao Yu, Shiqian Zhao, Chenlong Yin, Jinhu Fu, Yibo Yan, Hanjun Luo, Liang Lin, Zhihao Xu, Haolang Lu, Xinye Cao, Xinyun Zhou, Weifei Jin, Fanci Meng, Junyuan Mao, Hao Wu, Minghe Wang, Fan Zhang, Junfeng Fang, Chengwei Liu, Yifan Zhang, Qiankun Li, Chongye Guo, Yalan Qin, Yi Ding, Donghai Hong, Jiaming Ji, Xinfeng Li, Yifan Jiang, Dongxia Wang, Yihao Huang, Yufei Guo, Jen-tse Huang, Yanwei Yue, Wenke Huang, Guancheng Wan, Tianlin Li, Lei Bai, Jie Zhang, Qing Guo, Jingyi Wang, Tianlong Chen, Joey Tianyi Zhou, Xiaojun Jia, Weisong Sun, Cong Wu, Jing Chen, Xuming Hu, Yiming Li, Xiao Wang, Ningyu Zhang, Luu Anh Tuan, Guowen Xu, Tianwei Zhang, Xingjun Ma, Xiang Wang, Bo An, Jun Sun, Mohit Bansal, Shirui Pan, Yuval Elovici, Bhavya Kailkhura, Bo Li, Yaodong Yang, Hongwei Li, Wenyuan Xu, Yizhou Sun, Wei Wang, Qing Li, Ke Tang, Yu-Gang Jiang, Felix Juefei-Xu, Hui Xiong, Xiaofeng Wang, Shuicheng Yan, Dacheng Tao, Philip S. Yu, Qingsong Wen, Yang Liu
发布日期: 4/23/2025
arXiv ID: oai:arXiv.org:2504.15585v1

摘要

arXiv:2504.15585v1 安全类型: 横跨 摘要:大型语言模型(LLMs)的非凡成功照亮了通往实现人工通用智能的有希望的道路,这对学术界和工业界都充满了前景,这得益于它们在各种应用中前所未有的性能。随着LLMs在研究和商业领域中的重要性不断增加,其安全和安全性问题引起了广泛关注,不仅对研究者和企业,也对每一个国家来说都是如此。目前,现有对LLM安全性的调查主要集中在LLM生命周期的特定阶段,如部署阶段或微调阶段,缺乏对整个“生命链”的全面理解。为了填补这一空白,本文首次提出了“全栈”安全的概念,系统地考虑了从LLM训练到部署直至最终商业化过程中的安全问题。与现有的现成的LLM安全性调查相比,我们的工作展示了几个显著的优势:(I)全面视角。我们将完整的LLM生命周期定义为涵盖数据准备、预训练、后训练、部署和最终商业化。据我们所知,这是首次涵盖整个LLM生命周期的安全调查。(II)广泛的文献支持。我们的研究基于对超过800多篇论文的详尽回顾,确保了全面覆盖和系统的组织,从更整体的角度理解安全问题。(III)独特的见解。通过系统性的文献分析,我们为每一章发展出了可靠的道路图和视角。我们的工作确定了一些有前途的研究方向,包括数据生成中的安全性、对齐技术、模型编辑以及基于LLM的代理系统。这些见解为研究人员在未来在这个领域的研究提供了宝贵的指导。