LLM2D
中心协调的多代理 reinforcement 学习在电力网络拓扑控制中
Centrally Coordinated Multi-Agent Reinforcement Learning for Power Grid Topology Control
作者: Barbera de Mol, Davide Barbieri, Jan Viebahn, Davide Grossi
发布日期: 5/16/2025
arXiv ID: oai:arXiv.org:2502.08681v2

摘要

arXiv:2502.08681v2 Announce Type: replace-cross 摘要:由于可再生能源发电量的增加,电网运行正在变得越来越复杂。最近一系列运行电力网络的学习竞赛(L2RPN)鼓励使用人工代理来辅助人类调度员进行电网操作。然而,动作空间的组合性质对传统的优化器和学习控制器都构成了挑战。动作空间分解,即通过分解决策任务为更小的子任务来解决维度灾难,是一种应对方法。在此研究中,我们提出了一种中心协调多代理(CCMA)架构来实现动作空间分解。在此方法中,区域代理提出行动,然后协调代理选择最终行动。我们调查了几种CCMA架构的实现,并在不同的实验设置中与各种L2RPN基线方法进行了基准测试。CCMA架构在样本效率和最终性能上都优于基线方法。这些结果表明,CCMA方法在更高维度的L2RPN以及实际电网设置中具有很高的应用潜力。