摘要
本文提出一种新颖的依赖感知任务调度策略,用于动态无人机辅助联网自动驾驶汽车 (CAV)。具体来说,将由多个依赖子任务组成的 CAV 的不同计算任务合理地分配给附近的 CAV 或基站,以快速完成任务。因此,我们制定了一个联合调度优先级和子任务分配优化问题,目标是最小化平均任务完成时间。该问题旨在提高长期系统性能,并被重新表述为马尔可夫决策过程。为了解决这个问题,我们进一步提出了一种基于扩散的强化学习算法,称为基于合成 DDQN 的子任务调度,该算法可以实时做出自适应的任务调度决策。将基于扩散模型的合成经验回放集成到强化学习框架中,可以生成经验回放缓冲区中足够的合成数据,从而显著加快收敛速度并提高样本效率。仿真结果表明,与基准方案相比,该算法在减少任务完成时间方面是有效的。