LLM2D
UniGaussian:基于统一高斯表示的多摄像机模型驱动场景重建
UniGaussian: Driving Scene Reconstruction from Multiple Camera Models via Unified Gaussian Representations
作者: Yuan Ren, Guile Wu, Runhao Li, Zheyuan Yang, Yibo Liu, Xingxin Chen, Tongtong Cao, Bingbing Liu
发布日期: 11/26/2024
arXiv ID: oai:arXiv.org:2411.15355v1

摘要

城市场景重建对于真实的自动驾驶模拟器至关重要。尽管现有方法已经实现了逼真的重建效果,但它们大多关注针孔相机,而忽略了鱼眼相机。事实上,如何在驾驶场景中有效模拟鱼眼相机仍然是一个未解决的问题。在这项工作中,我们提出了UniGaussian,这是一种新颖的方法,它学习来自多种相机模型的统一三维高斯表示,用于自动驾驶中的城市场景重建。我们的贡献有两个方面。首先,我们提出了一种新的可微渲染方法,该方法使用一系列针对鱼眼相机模型定制的仿射变换来扭曲三维高斯分布。这解决了三维高斯散射与鱼眼相机的兼容性问题,该问题受到镜头或镜子引起的射线畸变的阻碍。此外,我们的方法在保证可微性的同时保持实时渲染。其次,基于可微渲染方法,我们设计了一个新的框架,该框架学习来自多种相机模型的统一高斯表示。通过应用仿射变换以适应不同的相机模型,并利用来自不同模态的监督来规范共享的高斯分布,我们的框架学习了一个统一的三维高斯表示,该表示具有来自多个来源的输入数据,并实现了对驾驶场景的整体理解。因此,我们的方法对多种传感器(针孔相机和鱼眼相机)和模态(深度、语义、法线和激光雷达点云)进行建模。我们的实验表明,我们的方法在驾驶场景模拟中实现了优越的渲染质量和快速的渲染速度。