LLM2D

摘要

arXiv:2407.02268v2 通告类型: replace-cross 摘要：人工智能（AI）在政府和私人行业的广泛应用带来了进步，同时也引发了隐私和安全方面的担忧。《通用数据保护条例》（GDPR）第17条规定了抹除权，要求从系统中永久删除数据，以防止潜在泄露。尽管现有研究主要集中在抹除敏感数据属性上，但仍有多个被动数据泄露机制未被充分探索和解决。其中一个问题来源于嵌入在预测模型中的训练数据残留足迹。测试数据和训练数据之间的性能差异可能会无意中揭示哪些数据点属于训练集，从而构成隐私风险。本研究探讨了分类器系统中的两个基本方面——训练数据质量和分类器训练方法——如何导致隐私漏洞。我们的理论分析表明，在数据不平衡和分布变化的条件下，分类器普遍表现出隐私漏洞。实证结果进一步支持了我们的理论结果，强调了训练数据质量在分类器易感性中的重要性。此外，我们的研究揭示了分类器的操作机制和架构设计对其漏洞的影响。我们还研究了通过数据模糊化技术的缓解策略，并分析了这些技术对隐私和分类性能的影响。为了帮助实践者，我们引入了一个隐私-性能权衡指数，提供了一种结构化的方法来平衡隐私保护与模型效果。研究结果为在各种实际应用中选择分类器和构建训练数据提供了有价值的见解。