摘要
arXiv:2409.08215v2 通知类型: 替换-交叉
摘要: 我们提出了LT3SD,这是一种新颖的潜空间扩散模型,用于大规模3D场景生成。最近在扩散模型方面的进展在3D对象生成方面展示了令人印象深刻的成果,但在将这些模型扩展到3D场景时,它们在空间范围和质量上受到了限制。为了生成复杂的和多样的3D场景结构,我们引入了一种潜空间树表示,以有效地在粗到细的层次结构中编码低频几何和高频细节。然后,我们可以在这一潜空间3D场景中学习生成扩散过程,在每个分辨率级别上建模场景的潜空间组件。为了合成不同大小的大规模场景,我们对场景块进行训练,并通过多场景块之间的共享扩散生成合成任意大小的输出3D场景。通过广泛的实验,我们证明了LT3SD在大规模、高质量无条件3D场景生成以及对部分场景观察的概率补全方面的有效性和优点。