LLM2D

摘要

近年来，由于利用了大规模文本到图像扩散模型的强大生成先验，纹理生成方法取得了令人印象深刻的成果。然而，抽象的文本提示在提供全局纹理或形状信息方面存在局限性，导致纹理生成方法产生的纹理模糊或不一致。为了解决这个问题，我们提出了 FlexiTex，它通过视觉引导嵌入丰富的信息来生成高质量的纹理。FlexiTex 的核心是视觉引导增强模块，该模块从视觉引导中整合了更具体的信息，以减少文本提示中的歧义并保留高频细节。为了进一步增强视觉引导，我们引入了一个方向感知自适应模块，该模块根据不同的相机姿态自动设计方向提示，避免了“雅努斯”问题并保持语义上的全局一致性。得益于视觉引导，FlexiTex 产生了定量和定性上都令人满意的结果，证明了其在推动纹理生成技术发展以用于现实世界应用的潜力。