LLM2D

摘要

arXiv:2503.00383v2 宣布类型: 替换-交叉摘要：通过局部编码原始数据为中间特征，协作推断使得终端用户能够利用强大的深度学习模型而不暴露敏感的原始数据给云服务器。然而，近期的研究发现，这些中间特征可能不能充分保护隐私，因为信息可以通过模型反向搜索攻击（MIAs）泄露，原始数据可以通过这些攻击重新构建。基于混淆的方法，如噪声污染、对抗性表示学习和信息过滤，通过混淆无关任务的冗余性来增强反向搜索的鲁棒性。然而，量化这种冗余性的方法仍然难以捉摸，关于这种冗余性最小化与反向搜索鲁棒性增强之间的显式数学关系尚未建立。为了解决这个问题，这项工作首先理论证明了给定中间特征的输入条件熵提供了任何MIAs下重建均方误差（MSE）的有保证的下界。然后，我们基于高斯混合估计推导出一个可微分且可求解的度量，用于在一个条件下边界限制条件熵，并提出了一种条件熵最大化（CEM）算法以增强反向搜索鲁棒性。在四个数据集上的实验结果表明，我们提出的CEM方法的有效性和适应性；在不牺牲特征效用和计算效率的情况下，将提出的CEM插入基于混淆的防御机制中，持续增强了其反向搜索鲁棒性，平均提升幅度在12.9%到48.2%之间。代码可访问 https://github.com/xiasong0501/CEM。