LLM2D

摘要

arXiv:2502.15119v1 宣布类型: cross 摘要：确保自主驾驶系统的安全性仍然是一个核心挑战，特别是在处理罕见但可能灾难性的安全关键场景方面。尽管现有的研究已经探讨了生成用于自主车辆（AV）测试的安全关键场景，但将这些场景有效纳入政策学习以提高安全性的工作还很有限。此外，开发适应自主车辆行为模式演变和性能瓶颈的训练课程表的方法仍很少被探索。为了解决这些挑战，我们提出了CurricuVLM，这是一种新颖的框架，利用视觉语言模型（VLMs）使自主驾驶代理的个性化课程学习成为可能。我们的方法独特地利用了VLMs的多模态理解能力来分析代理行为、识别性能弱点，并动态生成定制的训练场景以适应课程的调整。通过综合分析带有叙述描述的安全驾驶情况，CurricuVLM进行深入推理来评估AV的能力并识别关键行为模式。然后，框架合成针对这些识别出的限制量身定制的训练场景，从而实现有效的和个性化的课程学习。对Waymo Open Motion数据集的广泛实验表明，CurricuVLM在常规和安全关键场景中均优于最先进的基线，其导航成功率、驾驶效率和安全性指标均表现出更优的性能。进一步的分析表明，CurricuVLM可以作为一种通用方法，可以与各种RL算法集成以增强自主驾驶系统。代码和演示视频可在 https://zihaosheng.github.io/CurricuVLM/ 获取。