摘要
设计能够高效支持各种工作负载的通用型内存计算 (IMC) 硬件需要进行大量的设计空间探索,而手动执行此操作是不可行的。针对每个工作负载或仅针对最大工作负载单独优化硬件往往无法产生最有效的通用解决方案。为了解决这个问题,我们提出了一种联合硬件-工作负载优化框架,该框架可以识别优化的 IMC 芯片架构参数,从而实现更高效、更灵活的工作负载硬件。结果表明,与针对单个最大工作负载进行优化的单独架构参数搜索相比,联合优化在 VGG16、ResNet18、AlexNet 和 MobileNetV3 上分别实现了 36%、36%、20% 和 69% 的能耗-延迟-面积分数提升。此外,我们还量化了所得通用 IMC 硬件与特定工作负载 IMC 设计相比的性能权衡和损失。