摘要
arXiv:2504.08210v2 通告类型: replace-cross
摘要:由于可再生能源的集成水平不断提高以及需要更具适应性的控制策略,电网操作正变得越来越复杂。强化学习(RL)已 emergence 为一种有前景的电力网络控制(PNC)方法,能够通过提高在动态和不确定环境中的决策能力来增强控制。电力网络运行挑战赛(L2RPN)競賽在加速研究方面发挥了关键作用,通过提供标准化的比赛建议和问题表述,推动了基于RL方法的快速进展。本文综述了RL在电力网络拓扑优化中的应用,对现有技术进行了分类,突出了关键设计选择,并指出了当前研究中的空白。此外,还呈现了一项比较数值研究,评估了常用RL方法的影响,提供了对其实际有效性的见解。通过整合现有研究并概述开放挑战,本文旨在为基于RL的电力网络优化未来进步提供基础。