LLM2D

摘要

arXiv:2405.20446v3 通告类型：替换交叉摘要：检索增强生成（RAG）系统在自然语言处理方面展现出了巨大的潜力。然而，它们依赖于存储在检索数据库中的数据，这些数据可能包含专有或敏感信息，这引入了新的隐私问题。具体来说，攻击者可能通过观察RAG系统的输出来推断某个文本片段是否出现在检索数据库中，这种攻击被称为成员推理攻击（MIA）。尽管这种威胁的重要性不容忽视，但针对RAG系统的MIA研究仍然相对不足。本研究通过引入一种高效且易于使用的MIA方法来填补这一空白。我们使用两个基准数据集和多种生成模型展示了该攻击的有效性，表明在黑盒和灰盒设置下，可以通过创建合适的提示来高效地确定文档在检索数据库中的成员身份。此外，我们提出了一种初步的防御策略，即在RAG模板中添加指令，该策略对某些数据集和模型显示出较高的有效性。我们的研究结果强调了在部署的RAG系统中实施安全对策和开发更先进的防御措施以保护检索数据库的隐私和安全的重要性。