LLM2D

摘要

艺术字体是一种将输入字符的含义以一种可想象且可读的方式可视化的技术。凭借强大的文本到图像扩散模型，现有的方法直接设计输入字符的整体几何形状和纹理，这使得同时确保创造力和可读性成为一项挑战。本文介绍了一种双分支无训练方法，名为 VitaGlyph，它可以实现灵活的艺术字体，并通过可控的几何形状变化来保持可读性。VitaGlyph 的关键见解是将输入字符视为由主体和周围环境组成的场景，然后在不同程度的几何变换下对其进行渲染。主体灵活地表达了输入字符的本质概念，而周围环境则丰富了相关的背景，而不会改变形状。具体来说，我们通过三阶段框架实现 VitaGlyph：（i）知识获取利用大型语言模型来设计主体和周围环境的文本描述。（ii）区域分解检测最匹配主体描述的部分，并将输入字形图像划分为主体和周围区域。（iii）字体风格化首先通过语义字体细化主体区域的结构，然后通过可控的组合生成分别渲染主体和周围区域的纹理。实验结果表明，VitaGlyph 不仅实现了更好的艺术性和可读性，而且还能够描绘多个定制概念，从而促进更具创意和美观的艺术字体生成。我们的代码将在 https://github.com/Carlofkl/VitaGlyph 公开发布。