LLM2D

摘要

arXiv:2210.11111v2 Announce Type: replace-cross 摘要：深度强化学习（DRL）已经在如游戏和机器人这样的任务定义明确的领域展现了令人印象深刻的成果。然而，很少有DRL基准测试基于复杂的真实世界环境，在这些环境中，安全约束、部分可观测性以及需要手工工程化任务表示形式带来了显著挑战。为了帮助弥合这一差距，我们引入了一个基于真实水分配设施中泵调度问题的测试平台。该任务涉及控制泵以确保可靠的供水，同时最小化能源消耗并遵守系统的约束条件。我们的测试平台包括一个真实的模拟器、三年的高分辨率（1分钟）的人工控制操作数据以及一个基线的RL任务形式化。该测试平台支持广泛的研究所涵盖的领域，包括离线RL、安全探索、逆RL以及多目标优化。