LLM2D

摘要

arXiv:2409.12812v1 公告类型: 交叉摘要: 目前，互联自动驾驶汽车（CAVs）已开始在全球范围内进行道路测试，但在复杂场景中的安全性和效率表现仍不尽如人意。协同驾驶利用CAVs的互联能力，实现整体大于部分之和的协同效应，成为提升CAV在复杂场景中性能的有前景方法。然而，当前协同驾驶缺乏交互和持续学习能力，限制了其在单一场景和特定协同驾驶自动化（CDA）中的应用。为解决这些问题，本文提出了CoDrivingLLM，一个交互式且可学习的LLM驱动的协同驾驶框架，以实现全场景和全CDA。首先，由于大型语言模型（LLMs）不擅长处理数学计算，引入了一个环境模块，根据语义决策更新车辆位置，从而避免直接由LLM控制车辆位置可能带来的潜在错误。其次，基于SAE J3216标准定义的四个CDA级别，我们提出了一种基于思维链（COT）的推理模块，包括状态感知、意图共享、协商和决策，增强了LLMs在多步骤推理任务中的稳定性。通过推理过程中的冲突协调器进行集中冲突解决。最后，通过引入记忆模块并采用检索增强生成，CAVs被赋予了从过往经验中学习的能力。我们通过在协商模块上的消融实验、不同经验推理以及与其他协同驾驶方法的比较，验证了所提出的CoDrivingLLM。