LLM2D

摘要

arXiv:2504.03774v1 交叉类型：cross 摘要：在当今技术快速发展的时代，人工智能（AI）应用需要大规模、高性能和数据密集型计算，这导致了显著的能源需求。解决这一挑战需要硬件和软件创新的结合 approach。硬件制造商正在开发新的、高效且专门的解决方案，RISC-V 架构因其开放、可扩展和节能的指令集架构（ISA）而成为重要参与者。同时，软件开发者正在创建新的算法和框架，但它们的能源效率往往不明确。在这项研究中，我们对 64 核 SOPHON SG2042 RISC-V 架构上的机器学习（ML）应用进行了全面的基准分析。我们特别分析了 PyTorch、ONNX Runtime 和 TensorFlow 这三个领先 AI 框架下的深度学习推理模型的能耗。我们的研究发现，使用 XNNPACK 后端的框架，如 ONNX Runtime 和 TensorFlow，在能耗上比使用原生 OpenBLAS 后端编译的 PyTorch 更低。