LLM2D
墨韵:一种基于扩散模型的特定风格汉字书法生成方法
Moyun: A Diffusion-Based Model for Style-Specific Chinese Calligraphy Generation
作者: Kaiyuan Liu, Jiahao Mei, Hengyu Zhang, Yihuai Zhang, Xingjiao Wu, Daoguo Dong, Liang He
发布日期: 10/11/2024
arXiv ID: oai:arXiv.org:2410.07618v1

摘要

尽管中文书法生成已经实现了风格迁移,但通过指定书法家、字体和字体的风格来生成书法仍然是一个挑战。为了解决这个问题,我们提出了一种新的中文书法生成模型“墨云”,它用 Vision Mamba 替换了 Diffusion 模型中的 Unet,并引入了 TripleLabel 控制机制来实现可控书法生成。该模型在超过 190 万张图像的大规模数据集“墨宝”上进行了测试,结果表明“墨云”可以有效地控制生成过程,并以指定风格生成书法。即使是书法家从未写过的书法,“墨云”也能生成与书法家风格相符的书法。