摘要
arXiv:2504.13314v1 宣布类型: 新作
摘要:欧盟的人工智能(AI)法案为高风险领域定义了稳健性、韧性和安全性要求,但缺乏详细的评估方法。本文介绍了一个新的框架,用于定量评估强化学习代理在拥堵管理中的稳健性和韧性。通过使用AI友好的数字环境Grid2Op,扰动代理通过扰动AI系统的输入来模拟自然和敌对的中断,而不改变环境的实际状态,从而可以在各种场景下评估AI的性能。通过稳定性和奖励影响指标衡量稳健性,而韧性则通过绩效下降后的恢复能力来衡量。结果表明,该框架在识别漏洞并提高关键应用中AI的稳健性和韧性方面具有有效性。