LLM2D

摘要

arXiv:2501.15085v2 通知类型：替换摘要：近年来信息技术和人工智能的进步推动了数据中心（DC）行业在全球范围内的快速扩展，伴随着对电力的巨大需求以支持DC运行。在典型的数据中心中，大约30%至40%的能量被用来冷却系统，而不是用于计算机服务器，这迫切需要开发新的适用于DC冷却系统的节能优化技术。然而，优化这样的工业系统面临着诸多挑战，包括但不限于缺乏可靠的模拟环境、历史数据有限以及严格的安全性和控制鲁棒性要求。在这项工作中，我们提出了一种基于物理信息的离线强化学习（RL）框架，以优化数据中心冷却系统的能效。所提出的方法利用专门设计的图神经网络架构模型来描述服务器机房内的复杂动态模式和物理依赖关系，并符合基本的时间反转对称性。由于其良好的行为特性和可泛化的状态-动作表示，该模型能够利用有限的实际运营数据进行高效且鲁棒的潜在空间离线策略学习。我们已经将该框架成功部署并验证在一个大型生产数据中心，用于其空气冷却单元（ACU）的闭环控制。我们在生产环境中总共进行了2000小时的短期和长期实验。结果显示，我们的方法在数据中心冷却系统中实现了14%至21%的节能，同时没有违反任何安全或操作约束。我们的结果证明，离线RL在解决一系列数据有限、安全性关键的工业控制问题方面具有巨大的潜力。