LLM2D

摘要

arXiv:2410.13415v3 公布类型: replace-cross 摘要：减压操作是提高数字电路显著能效的有效技术。本文介绍了一种简单方法，只需进行软件修改即可使深度神经网络（DNN）加速器实现减压操作。传统的实现减压操作的方法，例如定时误差检测（TED）系统，会带来显著的开发成本和额外开销，而不适用于现成的组件。与此相反，本文提出的方法依赖于基于算法的误差检测，因此开发成本低，不需要任何电路修改，并且即使对于普通设备也适用。通过在流行的 DNN（即 LeNet 和 VGG16）和 GPU 平台上进行实验，我们展示了在没有任何模型准确率损失的情况下，通过整合误差检测方案实现 18% 至 25% 的节能率，并且从整合误差检测方案到 DNN 的开销来看，吞吐量损失不到 3.9%。将本文提出的算法解决方案集成到设计中比基于 TED 的传统方法更简单，后者需要在电路级别进行广泛的修改、单元库表征或特殊的设计工具支持。