摘要
arXiv:2502.00040v1 类别: cross
摘要: 随着各领域的电气化要求传输更多的电力,输电网的阻塞不断增加。通过变电站重新配置进行的拓扑控制可以减少阻塞,但在运行中的潜力尚未充分利用。一个挑战是将拓扑控制问题建模为与操作员的目标和约束相一致。为了解决这一挑战,本文研究了多目标强化学习(MORL)在集成电力系统拓扑控制的多个冲突目标方面的应用。我们开发了一种使用深度乐观线性支持(DOL)和多目标近端策略优化(MOPPO)的MORL方法,以生成一组帕累托最优策略,这些策略能够平衡诸如减少线路负载、拓扑偏差和切换频率等目标。初步的案例研究显示,MORL方法可以提供关于目标权衡的有价值见解,并在帕累托前沿逼近方面优于随机搜索基线。生成的多目标RL策略在 contingency 条件下防止电网故障的成功率比常用的单目标RL策略高出30%,并且在减少训练预算时也比单目标RL策略有效20%。