LLM2D

摘要

arXiv:2503.19195v1 类别: cross 摘要: 矿山作业优化，特别是卡车调度，是提高露天矿山作业效率的关键因素。然而，矿山环境的动态和不确定性性质，例如设备故障、卡车维护和变量的装载循环时间，给传统的优化方法带来了显著挑战。尽管强化学习（RL）在矿山物流的适应性决策方面显示出潜力，但其实际应用需要在现实且可定制的模拟环境中进行严格的评估。缺乏标准化的基准测试环境限制了算法之间的公平比较、可重复性和基于RL的方法在露天矿山现场的实际应用。为应对这一挑战，我们引入了Mining Gym，这是一个可配置的开源基准测试环境，旨在为矿山过程优化中的RL算法进行训练、测试和比较。Mining Gym建立在离散事件仿真（DES）之上，并无缝集成到OpenAI Gym接口中，提供了一个结构化的测试环境，可以直接应用来自Stable Baselines的高级RL算法。该框架模拟了关键的矿山特定不确定性，如设备故障、队列拥堵和矿山过程的随机性，确保了一个现实且适应性学习环境。此外，Mining Gym还配备了图形用户界面（GUI）以实现直观的矿山现场配置、完整的数据日志系统、内嵌的KPI仪表板以及矿山现场的实时可视化展示。这些功能促进了多种RL策略和基准启发式方法的标准化可重复评估。