摘要
arXiv:2504.05908v1 Announce Type: 多选择
摘要:驾驶场景理解是一个关键的实际问题,涉及解释和关联驾驶环境中各种元素,如车辆、行人和交通信号。尽管在自动驾驶方面取得了进展,但传统的管道依赖于确定性模型,这些模型无法捕捉到现实世界驾驶的概率特性和内在不确定性。为此,我们提出了PRIMEDrive-CoT,一种新的在驾驶场景中具有不确定性意识的对象交互和链式思考(CoT)推理模型。特别是,我们的方法结合了基于LiDAR的3D物体检测和多视图RGB参考,以确保可解释和可靠的场景理解。不确定性与风险评估,以及对象交互,通过贝叶斯图神经网络(BGNNs)进行概率推理,以便在模棱两可的条件下进行推理。通过利用对象动力学和上下文线索的链式思考来促进可解释决策,并通过Grad-CAM可视化突出显示注意力区域。在DriveCoT数据集上的全面评估表明,PRIMEDrive-CoT在现有的CoT和风险感知模型中表现出色。