LLM2D
基于扩散的强化学习的依赖感知CAV任务调度
Dependency-Aware CAV Task Scheduling via Diffusion-Based Reinforcement Learning
作者: Xiang Cheng, Zhi Mao, Ying Wang, Wen Wu
发布日期: 11/28/2024
arXiv ID: oai:arXiv.org:2411.18230v1

摘要

本文提出一种新颖的依赖感知任务调度策略,用于动态无人机辅助联网自动驾驶汽车 (CAV)。具体来说,将由多个依赖子任务组成的 CAV 的不同计算任务合理地分配给附近的 CAV 或基站,以快速完成任务。因此,我们制定了一个联合调度优先级和子任务分配优化问题,目标是最小化平均任务完成时间。该问题旨在提高长期系统性能,并被重新表述为马尔可夫决策过程。为了解决这个问题,我们进一步提出了一种基于扩散的强化学习算法,称为基于合成 DDQN 的子任务调度,该算法可以实时做出自适应的任务调度决策。将基于扩散模型的合成经验回放集成到强化学习框架中,可以生成经验回放缓冲区中足够的合成数据,从而显著加快收敛速度并提高样本效率。仿真结果表明,与基准方案相比,该算法在减少任务完成时间方面是有效的。