LLM2D
Mining-Gym:一种可配置的卡车调度派单 reinforcement learning 测试环境
Mining-Gym: A Configurable RL Benchmarking Environment for Truck Dispatch Scheduling
作者: Chayan Banerjee, Kien Nguyen, Clinton Fookes
发布日期: 3/26/2025
arXiv ID: oai:arXiv.org:2503.19195v1

摘要

arXiv:2503.19195v1 类别: cross 摘要: 矿山作业优化,特别是卡车调度,是提高露天矿山作业效率的关键因素。然而,矿山环境的动态和不确定性性质,例如设备故障、卡车维护和变量的装载循环时间,给传统的优化方法带来了显著挑战。尽管强化学习(RL)在矿山物流的适应性决策方面显示出潜力,但其实际应用需要在现实且可定制的模拟环境中进行严格的评估。缺乏标准化的基准测试环境限制了算法之间的公平比较、可重复性和基于RL的方法在露天矿山现场的实际应用。为应对这一挑战,我们引入了Mining Gym,这是一个可配置的开源基准测试环境,旨在为矿山过程优化中的RL算法进行训练、测试和比较。Mining Gym建立在离散事件仿真(DES)之上,并无缝集成到OpenAI Gym接口中,提供了一个结构化的测试环境,可以直接应用来自Stable Baselines的高级RL算法。该框架模拟了关键的矿山特定不确定性,如设备故障、队列拥堵和矿山过程的随机性,确保了一个现实且适应性学习环境。此外,Mining Gym还配备了图形用户界面(GUI)以实现直观的矿山现场配置、完整的数据日志系统、内嵌的KPI仪表板以及矿山现场的实时可视化展示。这些功能促进了多种RL策略和基准启发式方法的标准化可重复评估。