LLM2D

摘要

大型语言模型（LLMs）因其卓越的推理和理解能力而近来备受关注。本研究探索将 LLMs 应用于车联网，旨在联合优化车路协同 (V2I) 通信和自动驾驶 (AD) 策略。我们将 LLMs 用于 AD 决策，以最大化交通流量并避免碰撞以确保道路安全；并采用双重深度 Q 学习算法 (DDQN) 进行 V2I 优化，以最大化接收数据速率并减少频繁切换。具体而言，对于 LLM 驱动的 AD，我们采用欧几里得距离来识别先前探索的 AD 经验，然后 LLMs 可以从过去的优劣决策中学习，以进一步改进。随后，基于 LLM 的 AD 决策将成为 V2I 问题中的状态的一部分，DDQN 将相应地优化 V2I 决策。在此之后，AD 和 V2I 决策将迭代优化，直至收敛。这种迭代优化方法可以更好地探索 LLMs 与传统强化学习技术之间的相互作用，揭示使用 LLMs 进行网络优化和管理的潜力。最后，仿真结果表明，我们提出的混合 LLM-DDQN 方法优于传统的 DDQN 算法，展现出更快的收敛速度和更高的平均奖励。