LLM2D

摘要

arXiv:2501.15564v2 宣布类型: replace-cross 摘要：在复杂开放世界环境中实现类人驾驶行为是自动驾驶中的一个关键挑战。当前基于学习的规划方法，如模仿学习方法，往往难以在竞争性目标之间取得平衡，并且缺乏安全性保障，这是由于其适应性有限，无法学习人类规划中经常表现出的复杂多模态行为，更不用说它们对预定义规则依赖性较强。我们提出了一种新颖的基于变换器的扩散规划器，用于闭环规划，该规划器可以有效地建模多模态驾驶行为，而不依赖于任何基于规则的改进，从而保证轨迹质量。我们的模型支持在相同架构下同时建模预测和规划任务，从而实现车辆之间的协同行为。此外，通过学习轨迹得分函数的梯度并采用灵活的分类器指导机制，扩散规划器有效地实现了安全和适应性的规划行为。在大规模真实世界自主规划基准nuPlan和我们新收集的200小时的配送车辆驾驶数据集上的评估表明，扩散规划器在各种驾驶样式的鲁棒可转移性方面达到了最先进的闭环性能。