LLM2D

摘要

人工智能 (AI) 系统拥有推动社会进步的巨大潜力。然而，由于重大的安全问题，它们的部署往往面临障碍。安全强化学习 (SafeRL) 作为一种解决方案，可以在优化策略的同时遵守多个约束，从而解决了在安全关键场景中集成强化学习的挑战。本文介绍了一个名为 Safety-Gymnasium 的环境套件，其中包含单一和多智能体场景中的安全关键任务，接受向量和仅视觉输入。此外，我们还提供了一个名为安全策略优化 (SafePO) 的算法库，其中包含 16 种最先进的 SafeRL 算法。这个全面的库可以作为研究社区的验证工具。通过引入这个基准，我们旨在促进安全性能的评估和比较，从而推动强化学习的发展，使其在现实世界中的应用更加安全、可靠和负责任。该项目的网站可访问 https://sites.google.com/view/safety-gymnasium。