LLM2D

摘要

arXiv:2502.08681v2 Announce Type: replace-cross 摘要：由于可再生能源发电量的增加，电网运行正在变得越来越复杂。最近一系列运行电力网络的学习竞赛（L2RPN）鼓励使用人工代理来辅助人类调度员进行电网操作。然而，动作空间的组合性质对传统的优化器和学习控制器都构成了挑战。动作空间分解，即通过分解决策任务为更小的子任务来解决维度灾难，是一种应对方法。在此研究中，我们提出了一种中心协调多代理（CCMA）架构来实现动作空间分解。在此方法中，区域代理提出行动，然后协调代理选择最终行动。我们调查了几种CCMA架构的实现，并在不同的实验设置中与各种L2RPN基线方法进行了基准测试。CCMA架构在样本效率和最终性能上都优于基线方法。这些结果表明，CCMA方法在更高维度的L2RPN以及实际电网设置中具有很高的应用潜力。