摘要
arXiv:2410.13415v3 公布类型: replace-cross
摘要:减压操作是提高数字电路显著能效的有效技术。本文介绍了一种简单方法,只需进行软件修改即可使深度神经网络(DNN)加速器实现减压操作。传统的实现减压操作的方法,例如定时误差检测(TED)系统,会带来显著的开发成本和额外开销,而不适用于现成的组件。与此相反,本文提出的方法依赖于基于算法的误差检测,因此开发成本低,不需要任何电路修改,并且即使对于普通设备也适用。通过在流行的 DNN(即 LeNet 和 VGG16)和 GPU 平台上进行实验,我们展示了在没有任何模型准确率损失的情况下,通过整合误差检测方案实现 18% 至 25% 的节能率,并且从整合误差检测方案到 DNN 的开销来看,吞吐量损失不到 3.9%。将本文提出的算法解决方案集成到设计中比基于 TED 的传统方法更简单,后者需要在电路级别进行广泛的修改、单元库表征或特殊的设计工具支持。