LLM2D
CVT-Occ:用于三维占据预测的成本体积时间融合
CVT-Occ: Cost Volume Temporal Fusion for 3D Occupancy Prediction
发布日期: 9/23/2024
arXiv ID: oai:arXiv.org:2409.13430v1

摘要

基于视觉的三维占据预测在深度估计方面面临着单目视觉的固有限制。本文介绍了CVT-Occ,一种利用时间融合通过时间上体素的几何对应关系来提高三维占据预测准确性的新方法。通过沿每个体素的视线方向采样点,并整合这些点从历史帧中的特征,我们构建了一个成本体积特征图,用于优化当前体积特征以提高预测结果。我们的方法利用历史观测中的视差线索,并采用数据驱动的方法来学习成本体积。通过在Occ3D-Waymo数据集上的严格实验,我们验证了CVT-Occ的有效性,它在三维占据预测中优于最先进的方法,且计算成本增加最小。代码已在\url{https://github.com/Tsinghua-MARS-Lab/CVT-Occ}发布。