LLM2D
FlexiTex:利用视觉引导增强纹理生成
FlexiTex: Enhancing Texture Generation with Visual Guidance
作者: DaDong Jiang, Xianghui Yang, Zibo Zhao, Sheng Zhang, Jiaao Yu, Zeqiang Lai, Shaoxiong Yang, Chunchao Guo, Xiaobo Zhou, Zhihui Ke
发布日期: 9/26/2024
arXiv ID: oai:arXiv.org:2409.12431v3

摘要

近年来,由于利用了大规模文本到图像扩散模型的强大生成先验,纹理生成方法取得了令人印象深刻的成果。然而,抽象的文本提示在提供全局纹理或形状信息方面存在局限性,导致纹理生成方法产生的纹理模糊或不一致。为了解决这个问题,我们提出了 FlexiTex,它通过视觉引导嵌入丰富的信息来生成高质量的纹理。FlexiTex 的核心是视觉引导增强模块,该模块从视觉引导中整合了更具体的信息,以减少文本提示中的歧义并保留高频细节。为了进一步增强视觉引导,我们引入了一个方向感知自适应模块,该模块根据不同的相机姿态自动设计方向提示,避免了“雅努斯”问题并保持语义上的全局一致性。得益于视觉引导,FlexiTex 产生了定量和定性上都令人满意的结果,证明了其在推动纹理生成技术发展以用于现实世界应用的潜力。