摘要
arXiv:2504.04982v1 公告类型:新
摘要:作为关键基础设施的数据中心(DC)在推动人工智能(AI)和数字经济的增长中发挥着重要作用。从互联网数据中心(IDC)到人工智能数据中心(AIDC)的演变引入了新的运营和管理挑战,以提高业务韧性并降低总拥有成本。因此,未来数据中心需要超越传统基于最佳实践的方法的新范式。在本研究中,我们提出并开发了一个新颖的物理AI(PhyAI)框架,以推动数据中心运营和管理的进步。我们的系统利用了最先进的工业产品和我们内部的研发能力。具体来说,它呈现了三个核心模块,即:1)一种工业级的内部仿真引擎,以高度准确的方式模拟数据中心的运行,2)基于NVIDIA PhysicsNemo构建的AI引擎,用于物理感知机器学习(PIML)模型的训练和评估,以及3)基于NVIDIA Omniverse构建的数字孪生平台,用于我们提出的5级数字孪生框架。该系统提供了一个可扩展和适应性强的解决方案,以数字化、优化并自动化未来的数据中心运营和管理,通过为未来的数据中心提供实时数字孪生。为了展示其有效性,我们提供了一个案例研究,介绍了一种用于实时预测大规模数据中心的热特性和气流特征的代理模型。我们的结果显示,相比于传统的耗时计算流体力学/传热(CFD/HT)仿真,其性能更为优越,中位绝对温度预测误差为0.18℃。这一新兴的方法将为未来数据中心物理AI的进步打开几个潜在的研究方向。