LLM2D
通过物理AI转变未来数据中心的运营与管理
Transforming Future Data Center Operations and Management via Physical AI
作者: Zhiwei Cao, Minghao Li, Feng Lin, Jimin Jia, Yonggang Wen, Jianxiong Yin, Simon See
发布日期: 4/16/2025
arXiv ID: oai:arXiv.org:2504.04982v2

摘要

arXiv:2504.04982v2 宣布类型: 替换 摘要:作为关键基础设施的数据中心在推动人工智能(AI)和数字经济的增长方面发挥着至关重要的作用。从互联网数据中心(Internet DC)到人工智能数据中心(AI DC)的演变,为提高业务弹性和降低总体拥有成本带来了新的运营和管理挑战。因此,未来数据中心必须超越基于最佳实践的传统方法,引入新的范式。在本研究中,我们提出了一个新型的物理AI(PhyAI)框架,以提高数据中心的运营和管理。我们的系统利用了先进的工业产品能力和我们内部的研究与开发。具体而言,它包含三个核心模块:1)一个工业级的内部仿真引擎,可高度准确地模拟数据中心的运行;2)基于NVIDIA PhysicsNemo构建的AI引擎,用于物理知情机器学习(PIML)模型的训练和评估;3)在NVIDIA Omniverse基础上构建的数字孪生平台,用于我们提出的五层数字孪生框架。该系统提供了一个可扩展且适应性强的解决方案,通过实现未来数据中心的实时数字孪生,实现未来数据中心的数字化、优化和自动化。为了展示其有效性,我们提供了一个关于构建用于实时预测大型数据中心的热力学和空气流动特性的代理模型的案例研究。我们的结果显示,其性能优于传统的耗时计算流体动力学/热传递(CFD/HT)仿真,中位绝对温度预测误差为0.18℃。这种方法为未来数据中心的物理AI研究开辟了多个潜在的研究方向。