摘要
场景速写旨在将场景转换为简化的抽象表示,以捕捉原始场景的本质元素和构图。它需要对场景进行语义理解,并考虑场景中的不同区域。由于场景通常包含跨越各个区域的各种视觉信息,例如前景物体、背景元素和空间划分,处理这些不同区域带来了独特的困难。在本文中,我们定义速写为一些贝塞尔曲线集。我们对输入场景的不同区域进行多轮优化。在每一轮优化中,从下一区域采样的笔触可以无缝地集成到前一轮优化生成的速写中。我们提出了额外的笔触初始化方法,以确保场景的完整性和优化的收敛性。利用新颖的基于 CLIP 的语义损失和基于 VGG 的特征损失来指导我们的多轮优化。在生成的速写的质量和数量方面进行的大量实验结果证实了我们方法的有效性。