摘要
arXiv:2409.12812v1 公告类型: 交叉 摘要: 目前,互联自动驾驶汽车(CAVs)已开始在全球范围内进行道路测试,但在复杂场景中的安全性和效率表现仍不尽如人意。协同驾驶利用CAVs的互联能力,实现整体大于部分之和的协同效应,成为提升CAV在复杂场景中性能的有前景方法。然而,当前协同驾驶缺乏交互和持续学习能力,限制了其在单一场景和特定协同驾驶自动化(CDA)中的应用。为解决这些问题,本文提出了CoDrivingLLM,一个交互式且可学习的LLM驱动的协同驾驶框架,以实现全场景和全CDA。首先,由于大型语言模型(LLMs)不擅长处理数学计算,引入了一个环境模块,根据语义决策更新车辆位置,从而避免直接由LLM控制车辆位置可能带来的潜在错误。其次,基于SAE J3216标准定义的四个CDA级别,我们提出了一种基于思维链(COT)的推理模块,包括状态感知、意图共享、协商和决策,增强了LLMs在多步骤推理任务中的稳定性。通过推理过程中的冲突协调器进行集中冲突解决。最后,通过引入记忆模块并采用检索增强生成,CAVs被赋予了从过往经验中学习的能力。我们通过在协商模块上的消融实验、不同经验推理以及与其他协同驾驶方法的比较,验证了所提出的CoDrivingLLM。