LLM2D
安全-健身房:一个统一的安全强化学习基准
Safety-Gymnasium: A Unified Safe Reinforcement Learning Benchmark
作者: Jiaming Ji, Borong Zhang, Jiayi Zhou, Xuehai Pan, Weidong Huang, Ruiyang Sun, Yiran Geng, Yifan Zhong, Juntao Dai, Yaodong Yang
发布日期: 10/8/2024
arXiv ID: oai:arXiv.org:2310.12567v3

摘要

人工智能 (AI) 系统拥有推动社会进步的巨大潜力。然而,由于重大的安全问题,它们的部署往往面临障碍。安全强化学习 (SafeRL) 作为一种解决方案,可以在优化策略的同时遵守多个约束,从而解决了在安全关键场景中集成强化学习的挑战。本文介绍了一个名为 Safety-Gymnasium 的环境套件,其中包含单一和多智能体场景中的安全关键任务,接受向量和仅视觉输入。此外,我们还提供了一个名为安全策略优化 (SafePO) 的算法库,其中包含 16 种最先进的 SafeRL 算法。这个全面的库可以作为研究社区的验证工具。通过引入这个基准,我们旨在促进安全性能的评估和比较,从而推动强化学习的发展,使其在现实世界中的应用更加安全、可靠和负责任。该项目的网站可访问 https://sites.google.com/view/safety-gymnasium。