摘要
arXiv:2411.09540v2 通告类型: replace-cross
摘要:视觉提示(VP)是一种新的技术,能够将冻结的预训练模型适配到源域任务,用于目标域任务。本研究探讨了VP在黑盒模型级别后门检测中的优势。在VP中,视觉提示将源域和目标域的类子空间进行映射。我们发现了清洁数据集和受污染数据集之间的一个不匹配现象,称为类子空间不一致。基于此,我们提出了一种名为\textsc{BProm}的黑盒模型级别检测方法,用于识别可疑模型中的后门,如果存在后门的话。\textsc{BProm}利用了模型在存在后门时分类准确率较低的现象。广泛的实验验证了\textsc{BProm}的有效性。