LLM2D

摘要

arXiv:2504.13314v1 宣布类型: 新作摘要：欧盟的人工智能（AI）法案为高风险领域定义了稳健性、韧性和安全性要求，但缺乏详细的评估方法。本文介绍了一个新的框架，用于定量评估强化学习代理在拥堵管理中的稳健性和韧性。通过使用AI友好的数字环境Grid2Op，扰动代理通过扰动AI系统的输入来模拟自然和敌对的中断，而不改变环境的实际状态，从而可以在各种场景下评估AI的性能。通过稳定性和奖励影响指标衡量稳健性，而韧性则通过绩效下降后的恢复能力来衡量。结果表明，该框架在识别漏洞并提高关键应用中AI的稳健性和韧性方面具有有效性。