LLM2D

摘要

本文提出一种新颖的依赖感知任务调度策略，用于动态无人机辅助联网自动驾驶汽车 (CAV)。具体来说，将由多个依赖子任务组成的 CAV 的不同计算任务合理地分配给附近的 CAV 或基站，以快速完成任务。因此，我们制定了一个联合调度优先级和子任务分配优化问题，目标是最小化平均任务完成时间。该问题旨在提高长期系统性能，并被重新表述为马尔可夫决策过程。为了解决这个问题，我们进一步提出了一种基于扩散的强化学习算法，称为基于合成 DDQN 的子任务调度，该算法可以实时做出自适应的任务调度决策。将基于扩散模型的合成经验回放集成到强化学习框架中，可以生成经验回放缓冲区中足够的合成数据，从而显著加快收敛速度并提高样本效率。仿真结果表明，与基准方案相比，该算法在减少任务完成时间方面是有效的。