LLM2D

摘要

arXiv:2411.09540v2 通告类型: replace-cross 摘要：视觉提示（VP）是一种新的技术，能够将冻结的预训练模型适配到源域任务，用于目标域任务。本研究探讨了VP在黑盒模型级别后门检测中的优势。在VP中，视觉提示将源域和目标域的类子空间进行映射。我们发现了清洁数据集和受污染数据集之间的一个不匹配现象，称为类子空间不一致。基于此，我们提出了一种名为\textsc{BProm}的黑盒模型级别检测方法，用于识别可疑模型中的后门，如果存在后门的话。\textsc{BProm}利用了模型在存在后门时分类准确率较低的现象。广泛的实验验证了\textsc{BProm}的有效性。