摘要
arXiv:2410.16759v2 公告类型: 替换-交叉
摘要: 设计能够高效支持多种工作负载的一体化内存计算(IMC)硬件需要对大量设计方案进行探索,这 manual 实施起来是不切实际的。单独为每个工作负载优化硬件或仅针对最大的工作负载往往不能获得最高效的通用解决方案。为了解决这一问题,我们提出了一种联合硬件-工作负载优化框架,以识别优化的IMC芯片架构参数,从而实现更高效、负载灵活的硬件。我们展示了联合优化在分别针对VGG16、ResNet18、AlexNet和MobileNetV3的工作负载时,分别在能源-延迟-面积指标上比单独针对单个最大工作负载优化的架构参数搜索高出36%、36%、20%和69%。此外,我们量化了联合优化得到的通用IMC硬件与针对特定工作负载设计的IMC硬件之间的性能权衡和损失。