LLM2D
基于自注意力和进化强化学习的成本感知动态云工作流调度
Cost-Aware Dynamic Cloud Workflow Scheduling using Self-Attention and Evolutionary Reinforcement Learning
作者: Ya Shen, Gang Chen, Hui Ma, Mengjie Zhang
发布日期: 9/30/2024
arXiv ID: oai:arXiv.org:2409.18444v1

摘要

云环境下的成本感知动态多工作流调度 (CDMWS) 是一种云工作流管理问题,其目标是将虚拟机 (VM) 实例分配给工作流中的任务,以最小化总成本,包括违反服务等级协议 (SLA) 的罚款和 VM 租赁费用。基于深度神经网络,强化学习 (RL) 方法可以构建有效的调度策略来解决 CDMWS 问题。传统的 RL 策略网络通常使用基本的前馈架构来分别确定分配任何 VM 实例的适用性,而没有同时考虑所有 VM 来学习它们的全局信息。本文提出了一种用于云工作流调度的新型自注意力策略网络 (SPN-CWS),该网络可以捕获所有 VM 的全局信息。我们还开发了一个基于进化策略的 RL (ERL) 系统,以可靠有效地训练 SPN-CWS。训练后的 SPN-CWS 可以有效地同时处理所有候选 VM 实例,以识别最适合执行每个工作流任务的 VM 实例。综合实验表明,我们的方法在多个基准 CDMWS 问题上明显优于几种最先进的算法。