LLM2D

摘要

对相机姿态的精确依赖是神经辐射场 (NeRF) 模型在 3D 重建和 SLAM 任务中广泛应用的重大障碍。现有的方法引入了单目深度先验来联合优化相机姿态和 NeRF，但这未能充分利用深度先验，也忽略了其固有噪声的影响。在本文中，我们提出了截断深度 NeRF (TD-NeRF)，这是一种新方法，它能够从未知相机姿态训练 NeRF - 通过联合优化辐射场的可学习参数和相机姿态。我们的方法通过三个关键改进显式地利用了单目深度先验：1）我们提出了一种基于截断正态分布的新型深度引导射线采样策略，这提高了姿态估计的收敛速度和精度；2）为了规避局部最小值并细化深度几何，我们引入了一种从粗到细的训练策略，逐步提高深度精度；3）我们提出了一种更稳健的帧间点约束，在训练期间增强了对深度噪声的鲁棒性。在三个数据集上的实验结果表明，TD-NeRF 在相机姿态和 NeRF 的联合优化方面取得了优异的性能，超越了以前的工作，并生成了更准确的深度几何。我们方法的实现已在 https://github.com/nubot-nudt/TD-NeRF 发布。