LLM2D

摘要

arXiv:2503.05794v3 通知类型: 替换-跨摘要：随着深度学习在说话人验证中的广泛应用，大规模语音数据集已成为宝贵的知识产权。为了审计并防止这些有价值的已发布数据集在商业或开源场景中的未经授权使用，我们提出了一种新型的数据集归属验证方法。该方法通过引入基于聚类的后门水印 (CBW)，使数据集所有者能够在黑盒环境中确定可疑第三方模型是否在受保护的数据集上进行了训练。CBW 方法包括两个关键阶段：数据集水印和归属验证。在嵌入水印过程中，我们将在数据集中植入多个触发模式，使得具有相似特征相似性的样本接近相同的触发，而相似度不同的样本则靠近不同的触发。这确保了任何在水印数据集上训练的模型，在暴露于嵌入触发的输入时，会表现出特定的错误分类行为。为了验证数据集归属，我们设计了一种基于假设检验的框架，通过统计评估可疑模型是否表现出预期的后门行为。我们对基准数据集进行了广泛的实验，验证了我们的方法在潜在适应性攻击下的有效性和稳健性。主要实验的代码可在 https://github.com/Radiant0726/CBW 查看。