LLM2D
面向大型机器学习的easy和现实的网络基础设施测试
Towards Easy and Realistic Network Infrastructure Testing for Large-scale Machine Learning
作者: Jinsun Yoo, ChonLam Lao, Lianjie Cao, Bob Lantz, Minlan Yu, Tushar Krishna, Puneet Sharma
发布日期: 4/30/2025
arXiv ID: oai:arXiv.org:2504.20854v1

摘要

arXiv:2504.20854v1 测试框架类型:跨平台 摘要:本文为Genie测试框架奠定了基础,该框架可以捕捉真实硬件网络行为对ML工作负载性能的影响,而无需使用昂贵的GPU。Genie使用CPU引发的流量在硬件测试床上来模拟GPU到GPU的通信,并将ASTRA-sim仿真器调整为建模网络与ML工作负载之间的交互。