摘要
对相机姿态的精确依赖是神经辐射场 (NeRF) 模型在 3D 重建和 SLAM 任务中广泛应用的重大障碍。现有的方法引入了单目深度先验来联合优化相机姿态和 NeRF,但这未能充分利用深度先验,也忽略了其固有噪声的影响。在本文中,我们提出了截断深度 NeRF (TD-NeRF),这是一种新方法,它能够从未知相机姿态训练 NeRF - 通过联合优化辐射场的可学习参数和相机姿态。我们的方法通过三个关键改进显式地利用了单目深度先验:1)我们提出了一种基于截断正态分布的新型深度引导射线采样策略,这提高了姿态估计的收敛速度和精度;2)为了规避局部最小值并细化深度几何,我们引入了一种从粗到细的训练策略,逐步提高深度精度;3)我们提出了一种更稳健的帧间点约束,在训练期间增强了对深度噪声的鲁棒性。在三个数据集上的实验结果表明,TD-NeRF 在相机姿态和 NeRF 的联合优化方面取得了优异的性能,超越了以前的工作,并生成了更准确的深度几何。我们方法的实现已在 https://github.com/nubot-nudt/TD-NeRF 发布。