摘要
大型语言模型(LLMs)因其卓越的推理和理解能力而近来备受关注。本研究探索将 LLMs 应用于车联网,旨在联合优化车路协同 (V2I) 通信和自动驾驶 (AD) 策略。我们将 LLMs 用于 AD 决策,以最大化交通流量并避免碰撞以确保道路安全;并采用双重深度 Q 学习算法 (DDQN) 进行 V2I 优化,以最大化接收数据速率并减少频繁切换。具体而言,对于 LLM 驱动的 AD,我们采用欧几里得距离来识别先前探索的 AD 经验,然后 LLMs 可以从过去的优劣决策中学习,以进一步改进。随后,基于 LLM 的 AD 决策将成为 V2I 问题中的状态的一部分,DDQN 将相应地优化 V2I 决策。在此之后,AD 和 V2I 决策将迭代优化,直至收敛。这种迭代优化方法可以更好地探索 LLMs 与传统强化学习技术之间的相互作用,揭示使用 LLMs 进行网络优化和管理的潜力。最后,仿真结果表明,我们提出的混合 LLM-DDQN 方法优于传统的 DDQN 算法,展现出更快的收敛速度和更高的平均奖励。