LLM2D

摘要

目前，联网自动驾驶汽车（CAVs）已经开始在全球范围内进行道路测试，但它们在复杂场景中的安全性和效率表现仍然不尽如人意。协同驾驶利用CAVs的连接能力，实现整体效果大于部分之和，使其成为改善CAV在复杂场景中表现的有前途的方法。然而，缺乏互动和持续学习能力限制了当前的协同驾驶只能应用于单一场景和特定的协同驾驶自动化（CDA）。为了解决这些挑战，本文提出了CoDrivingLLM，一个互动且可学习的基于大语言模型驱动的协同驾驶框架，以实现全场景和全CDA。首先，由于大语言模型（LLM）不擅长处理数学计算，引入了环境模块来基于语义决策更新车辆位置，从而避免了直接由LLM控制车辆位置可能带来的潜在错误。其次，基于SAE J3216标准定义的四个CDA级别，我们提出了一个基于思维链（COT）的推理模块，包括状态感知、意图共享、谈判和决策，增强LLMs在多步推理任务中的稳定性。然后，通过推理过程中的冲突协调员来管理集中冲突解决。最后，通过引入记忆模块并采用检索增强生成，赋予CAVs从过去经验中学习的能力。我们通过在谈判模块上的消融实验、不同镜头经验的推理以及与其他协同驾驶方法的比较来验证所提出的CoDrivingLLM。