LLM2D
SVGDreamer++:提升文本引导SVG生成的可编辑性和多样性
SVGDreamer++: Advancing Editability and Diversity in Text-Guided SVG Generation
作者: Ximing Xing, Qian Yu, Chuang Wang, Haitao Zhou, Jing Zhang, Dong Xu
发布日期: 11/28/2024
arXiv ID: oai:arXiv.org:2411.17832v1

摘要

近期,文本引导的可缩放矢量图形 (SVG) 合成在图标设计和素描等领域展现出巨大的潜力。然而,现有文本转SVG方法生成的SVG往往缺乏可编辑性,并在视觉质量和多样性方面存在不足。本文提出一种新颖的文本引导矢量图形合成方法来解决这些局限性。为了提高输出SVG的多样性,我们提出了一种基于矢量粒子的分数蒸馏 (VPSD) 方法。VPSD 解决了现有方法中过度饱和的问题,并增强了样本多样性。通过加入预训练的奖励模型来重新加权矢量粒子,从而提高了美感并加快了收敛速度。此外,我们设计了一种新颖的自适应矢量基元控制策略,允许动态调整基元的数量,从而增强图形细节的呈现。大量的实验验证了该方法的有效性,证明其在可编辑性、视觉质量和多样性方面优于基线方法。我们还展示了我们的新方法支持多达六种不同的矢量样式,能够生成适用于风格化矢量设计和海报设计的高质量矢量素材。