LLM2D

摘要

规划问题是自动驾驶框架的一个基本方面。近年来，表征学习的进步使得车辆能够理解其周围环境，从而促进了基于学习的规划策略的集成。在这些方法中，模仿学习因其显著的训练效率而脱颖而出。然而，传统的模仿学习方法面临着与协变量偏移现象相关的挑战。我们提出了一种基于失败的有效性学习方法，VL(on failure)，来解决这个问题。该方法的核心在于将预先训练的规划器部署到各种场景中。当规划器偏离其直接目标时，例如与障碍物保持安全距离或遵守交通规则，这些情况将被标记为失败。这些失败对应的状态被编译成一个新的数据集，称为失败数据集。值得注意的是，由于该数据缺乏专家标注，因此无法应用标准模仿学习方法。为了便于从闭环错误中学习，我们引入了VL目标，旨在识别当前环境背景下的有效轨迹。在反应式CARLA模拟和非反应式日志回放模拟上进行的实验评估表明，闭环指标（如分数、进度和成功率）得到了显著提升，这突出了所提方法的有效性。进一步针对Bench2Drive基准进行的评估表明，VL(on failure)在很大程度上优于最先进的方法。