LLM2D

摘要

最近的纹理生成方法由于利用了大规模文本到图像扩散模型中的强大生成先验，取得了令人印象深刻的成果。然而，抽象的文本提示在提供全局纹理或形状信息方面存在局限性，导致纹理生成方法生成的图案模糊或不一致。为了解决这个问题，我们提出了FlexiTex，通过视觉引导嵌入丰富的信息来生成高质量的纹理。FlexiTex的核心是视觉引导增强模块，该模块结合视觉引导中的更具体信息，以减少文本提示中的歧义，并保留高频细节。为了进一步增强视觉引导，我们引入了方向感知适配模块，该模块基于不同的相机姿态自动设计方向提示，避免了Janus问题并保持语义上的全局一致性。得益于视觉引导，FlexiTex生成了定量和定性上都令人满意的结果，展示了其在推进现实世界纹理生成应用中的潜力。