LLM2D
EPSILON:使用统计特征的自适应容错机制在近似深度神经网络中的应用
EPSILON: Adaptive Fault Mitigation in Approximate Deep Neural Network using Statistical Signatures
作者: Khurram Khalil, Khaza Anuarul Hoque
发布日期: 4/30/2025
arXiv ID: oai:arXiv.org:2504.20074v1

摘要

arXiv:2504.20074v1 类型: cross 摘要:深度神经网络加速器中日益采用近似计算(AxDNNs)有望显著提高能效。然而,AxDNNs 中的永久性故障会严重降低它们的性能,相比其准确的对应物(AccDNNs),性能会大幅下降。传统的方法虽然对于 AccDNNs 是有效的,但在 AccDNNs 上引入了大量开销和延迟,使得它们不适合受能效约束的实时部署。为了解决这一问题,我们提出了一种名为 EPSILON 的轻量级框架,该框架利用预计算的统计签名和层间重要性度量,以高效的方式在 AxDNNs 中检测和缓解故障。我们的框架引入了一种新颖的非参数模式匹配算法,能够在不中断正常执行的同时进行常数时间故障检测,并且能够根据不同网络架构和故障模式动态适应。EPSILON 通过基于权重分布和层关键性的统计分析来智能调整缓解策略,同时保持近似计算的能效好处,从而保持模型的准确性。在不同近似乘法器、AxDNN 架构、流行数据集(MNIST、CIFAR-10、CIFAR-100、ImageNet-1k)以及故障场景下的广泛评估表明,EPSILON 在保持 80.05% 的准确性的同时,提供 22% 的推理时间改进和 28% 的能效改进,确立了 EPSILON 作为一种在安全关键边缘应用中部署可靠 AxDNN 的实用解决方案。