LLM2D
电力网格拓扑控制的多目标强化学习
Multi-Objective Reinforcement Learning for Power Grid Topology Control
作者: Thomas Lautenbacher, Ali Rajaei, Davide Barbieri, Jan Viebahn, Jochen L. Cremer
发布日期: 2/4/2025
arXiv ID: oai:arXiv.org:2502.00040v1

摘要

arXiv:2502.00040v1 类别: cross 摘要: 随着各领域的电气化要求传输更多的电力,输电网的阻塞不断增加。通过变电站重新配置进行的拓扑控制可以减少阻塞,但在运行中的潜力尚未充分利用。一个挑战是将拓扑控制问题建模为与操作员的目标和约束相一致。为了解决这一挑战,本文研究了多目标强化学习(MORL)在集成电力系统拓扑控制的多个冲突目标方面的应用。我们开发了一种使用深度乐观线性支持(DOL)和多目标近端策略优化(MOPPO)的MORL方法,以生成一组帕累托最优策略,这些策略能够平衡诸如减少线路负载、拓扑偏差和切换频率等目标。初步的案例研究显示,MORL方法可以提供关于目标权衡的有价值见解,并在帕累托前沿逼近方面优于随机搜索基线。生成的多目标RL策略在 contingency 条件下防止电网故障的成功率比常用的单目标RL策略高出30%,并且在减少训练预算时也比单目标RL策略有效20%。