LLM2D

摘要

arXiv:2505.03859v1 类别: cross 摘要：多模态机器学习的进步使文本到图像（T2I）模型越来越易于获取且流行。然而，T2I 模型引入了生成可识别个体肖像的非自愿描绘的风险，这类问题通常被称为深度假体。本文探讨了在线可获取的深度假体模型变体的可访问性。通过对两个流行存储库 Hugging Face 和 Civitai 上数千个可供下载的深度假体模型变体的元数据进行分析，我们展示了可获取的深度假体模型的显著增加。总共识别出约 35,000 个可供下载的深度假体模型变体，主要托管在 Civitai 上。自 2022 年 11 月以来，这些深度假体模型已被下载近 1500 万次，涵盖从全球名人到拥有不到 10,000 粉丝的 Instagram 用户的广泛个体。稳定扩散模型和 Flux 模型都用于创建深度假体模型，其中 96% 的模型针对女性，且许多模型表明生成非自愿亲密图像 (NCII) 的意图。深度假体模型变体经常采用低秩适应 (LoRA) 这种参数高效的微调技术创建，只需 20 张图片、24GB VRAM 和 15 分钟的时间，这使得通过消费级计算机进行这一过程变得广泛可行。尽管这些模型违反了托管平台的服务条款，并且监管试图阻止传播，但这些结果强调了需要采取更大行动以应对深度假体和 NCII 的创建。