摘要
随着大型语言模型(LLM)在越来越多的应用中普及,对其相关安全风险的评估变得越来越必要。从虚假信息传播到数据泄露和声誉损害,恶意行为者利用这些模型的潜力是巨大的。本文填补了当前研究中的一个空白,特别关注于在基于提示的交互方案中,LLM所带来的安全风险,这超越了广泛报道的伦理和社会影响。我们的工作提出了一个用户模型通信管道中的安全风险分类法,并按照目标和攻击类型以及常用的保密性、完整性和可用性(CIA)三要素对攻击进行分类。该分类法通过具体的攻击实例加以巩固,以展示这些风险在现实世界中的影响。通过这一分类法,我们旨在为开发稳健和安全的LLM应用提供信息,增强其安全性和可信度。