摘要
arXiv:2501.00210v2 宣告类型: replace-cross
摘要:本文对Intel Gaudi NPUs作为NVIDIA GPU替代品在AI系统设计中的应用进行了全面评估,目前NVIDIA GPU是AI系统设计中的事实标准。首先,我们创建了一套微基准测试来比较Intel Gaudi-2与NVIDIA A100的表现,结果显示Gaudi-2不仅在基础的AI计算、内存和通信操作上取得了竞争力,还在端到端执行几个重要的AI工作负载时也表现出了竞争力。随后,我们通过讨论一些可以在软件层面实施的关键FBGEMM操作和vLLM的优化策略,来评估Gaudi NPU的可编程性,并将其效率与GPU优化的版本进行比较。结果显示,Gaudi-2在能效方面与A100相当,但在软件成熟度方面存在明显的改进空间。总体而言,我们得出结论,如果有效地集成到高级AI框架中,Gaudi NPUs有可能在AI服务器市场挑战NVIDIA GPU的主导地位,尽管还需要进一步改进以与NVIDIA强大的软件生态系统全面竞争。