LLM2D

摘要

云环境下的成本感知动态多工作流调度 (CDMWS) 是一种云工作流管理问题，其目标是将虚拟机 (VM) 实例分配给工作流中的任务，以最小化总成本，包括违反服务等级协议 (SLA) 的罚款和 VM 租赁费用。基于深度神经网络，强化学习 (RL) 方法可以构建有效的调度策略来解决 CDMWS 问题。传统的 RL 策略网络通常使用基本的前馈架构来分别确定分配任何 VM 实例的适用性，而没有同时考虑所有 VM 来学习它们的全局信息。本文提出了一种用于云工作流调度的新型自注意力策略网络 (SPN-CWS)，该网络可以捕获所有 VM 的全局信息。我们还开发了一个基于进化策略的 RL (ERL) 系统，以可靠有效地训练 SPN-CWS。训练后的 SPN-CWS 可以有效地同时处理所有候选 VM 实例，以识别最适合执行每个工作流任务的 VM 实例。综合实验表明，我们的方法在多个基准 CDMWS 问题上明显优于几种最先进的算法。