LLM2D

摘要

尽管中文书法生成已经实现了风格迁移，但通过指定书法家、字体和字体的风格来生成书法仍然是一个挑战。为了解决这个问题，我们提出了一种新的中文书法生成模型“墨云”，它用 Vision Mamba 替换了 Diffusion 模型中的 Unet，并引入了 TripleLabel 控制机制来实现可控书法生成。该模型在超过 190 万张图像的大规模数据集“墨宝”上进行了测试，结果表明“墨云”可以有效地控制生成过程，并以指定风格生成书法。即使是书法家从未写过的书法，“墨云”也能生成与书法家风格相符的书法。