摘要
arXiv:2403.04960v2 宣布类型:替换交叉引用
摘要:扩展为系统的大型语言模型(LLMs),如ChatGPT,已经开始支持第三方应用程序。这些LLM应用程序利用了LLMs实际上基于自然语言的自动化执行范式:即,应用程序及其交互以自然语言定义,具有访问用户数据的权限,并允许与其他应用程序和系统自由交互。这些LLM应用程序生态系统类似于早期计算平台的环境,在这些平台上,应用程序与系统之间的隔离不足。由于第三方应用程序可能不可信,并且受自然语言界面不精确的影响,当前的设计对用户构成了安全和隐私风险。在本文中,我们评估是否可以通过执行隔离来解决这些问题,以及在基于LLM的系统中,执行隔离可能是什么样子,这些系统存在任意的基于自然语言的组件交互、LLM和应用程序之间的交互,以及应用程序之间的交互。为此,我们提出了IsolateGPT的设计架构,证明了执行隔离的可行性,并为在基于LLM的系统中实现隔离提供了蓝图。我们对IsolateGPT进行了多种攻击评估,并证明它能够在不牺牲功能的情况下保护非隔离的基于LLM的系统中存在许多安全、隐私和安全问题。IsolateGPT提高安全性所带来的性能开销在测试的查询中超过四分之三的情况下不到30%。