LLM2D

摘要

近期，文本引导的可缩放矢量图形 (SVG) 合成在图标设计和素描等领域展现出巨大的潜力。然而，现有文本转SVG方法生成的SVG往往缺乏可编辑性，并在视觉质量和多样性方面存在不足。本文提出一种新颖的文本引导矢量图形合成方法来解决这些局限性。为了提高输出SVG的多样性，我们提出了一种基于矢量粒子的分数蒸馏 (VPSD) 方法。VPSD 解决了现有方法中过度饱和的问题，并增强了样本多样性。通过加入预训练的奖励模型来重新加权矢量粒子，从而提高了美感并加快了收敛速度。此外，我们设计了一种新颖的自适应矢量基元控制策略，允许动态调整基元的数量，从而增强图形细节的呈现。大量的实验验证了该方法的有效性，证明其在可编辑性、视觉质量和多样性方面优于基线方法。我们还展示了我们的新方法支持多达六种不同的矢量样式，能够生成适用于风格化矢量设计和海报设计的高质量矢量素材。