LLM2D

摘要

扩散模型在图像生成方面取得了显著进展。然而，与之前的生成模型相比，扩散模型面临着巨大的计算开销，导致无法实时生成。最近的方法旨在通过改进的采样技术或步骤蒸馏来减少采样步骤，从而加速扩散模型。然而，减少每个时间步的计算成本的方法仍然是一个相对未探索的领域。观察到扩散模型在不同的时间步具有不同的输入分布和特征分布，我们引入了“一对多”知识蒸馏 (O2MKD)，它将单个教师扩散模型蒸馏成多个学生扩散模型，其中每个学生扩散模型被训练来学习教师对连续时间步子集的知识。在 CIFAR10、LSUN Church、CelebA-HQ (使用 DDPM) 和 COCO30K (使用 Stable Diffusion) 上的实验表明，O2MKD 可以应用于之前知识蒸馏和快速采样方法，以实现显著的加速。代码将在 Github 上发布。