LLM2D
失败案例上的有效性学习:缓解自动驾驶规划中的分布偏移
Validity Learning on Failures: Mitigating the Distribution Shift in Autonomous Vehicle Planning
发布日期: 9/25/2024
arXiv ID: oai:arXiv.org:2406.01544v2

摘要

规划问题是自动驾驶框架的一个基本方面。近年来,表征学习的进步使得车辆能够理解其周围环境,从而促进了基于学习的规划策略的集成。在这些方法中,模仿学习因其显著的训练效率而脱颖而出。然而,传统的模仿学习方法面临着与协变量偏移现象相关的挑战。我们提出了一种基于失败的有效性学习方法,VL(on failure),来解决这个问题。该方法的核心在于将预先训练的规划器部署到各种场景中。当规划器偏离其直接目标时,例如与障碍物保持安全距离或遵守交通规则,这些情况将被标记为失败。这些失败对应的状态被编译成一个新的数据集,称为失败数据集。值得注意的是,由于该数据缺乏专家标注,因此无法应用标准模仿学习方法。为了便于从闭环错误中学习,我们引入了VL目标,旨在识别当前环境背景下的有效轨迹。在反应式CARLA模拟和非反应式日志回放模拟上进行的实验评估表明,闭环指标(如分数、进度和成功率)得到了显著提升,这突出了所提方法的有效性。进一步针对Bench2Drive基准进行的评估表明,VL(on failure)在很大程度上优于最先进的方法。