LLM2D

摘要

随着大型语言模型（LLM）在越来越多的应用中普及，对其相关安全风险的评估变得越来越必要。从虚假信息传播到数据泄露和声誉损害，恶意行为者利用这些模型的潜力是巨大的。本文填补了当前研究中的一个空白，特别关注于在基于提示的交互方案中，LLM所带来的安全风险，这超越了广泛报道的伦理和社会影响。我们的工作提出了一个用户模型通信管道中的安全风险分类法，并按照目标和攻击类型以及常用的保密性、完整性和可用性（CIA）三要素对攻击进行分类。该分类法通过具体的攻击实例加以巩固，以展示这些风险在现实世界中的影响。通过这一分类法，我们旨在为开发稳健和安全的LLM应用提供信息，增强其安全性和可信度。