摘要
arXiv:2505.03859v1 类别: cross
摘要:多模态机器学习的进步使文本到图像(T2I)模型越来越易于获取且流行。然而,T2I 模型引入了生成可识别个体肖像的非自愿描绘的风险,这类问题通常被称为深度假体。本文探讨了在线可获取的深度假体模型变体的可访问性。通过对两个流行存储库 Hugging Face 和 Civitai 上数千个可供下载的深度假体模型变体的元数据进行分析,我们展示了可获取的深度假体模型的显著增加。总共识别出约 35,000 个可供下载的深度假体模型变体,主要托管在 Civitai 上。自 2022 年 11 月以来,这些深度假体模型已被下载近 1500 万次,涵盖从全球名人到拥有不到 10,000 粉丝的 Instagram 用户的广泛个体。稳定扩散模型和 Flux 模型都用于创建深度假体模型,其中 96% 的模型针对女性,且许多模型表明生成非自愿亲密图像 (NCII) 的意图。深度假体模型变体经常采用低秩适应 (LoRA) 这种参数高效的微调技术创建,只需 20 张图片、24GB VRAM 和 15 分钟的时间,这使得通过消费级计算机进行这一过程变得广泛可行。尽管这些模型违反了托管平台的服务条款,并且监管试图阻止传播,但这些结果强调了需要采取更大行动以应对深度假体和 NCII 的创建。