摘要
arXiv:2502.06516v1 交叉公告类型:cross
摘要:少数样本是位于数据流形低密度区域的未充分代表的实例,在许多生成AI应用中都很有价值,如数据增强、创意内容生成等。不幸的是,现有的基于扩散的少数样本生成器通常依赖于专用的、计算成本高昂的指导,专门针对少数样本的生成。为了解决这个问题,我们提出了一个简单而强大的无需指导的方法Boost-and-Skip,用于使用扩散模型生成少数样本。我们框架的关键优势仅需对标准生成过程进行两项最小更改:(i) 方差提升的初始化和(ii) 时间步骤跳过。我们强调,这些看似简单的修改得到了坚实的理论和实证证据支持,从而有效地促进了未充分代表的少数样本特征的出现。我们的全面实验表明,Boost-and-Skip大大提高了生成少数样本的能力,甚至在计算量显著减少的情况下,也能与基于指导的最先进的方法相媲美。