LLM2D

摘要

arXiv:2504.20074v1 类型: cross 摘要：深度神经网络加速器中日益采用近似计算（AxDNNs）有望显著提高能效。然而，AxDNNs 中的永久性故障会严重降低它们的性能，相比其准确的对应物（AccDNNs），性能会大幅下降。传统的方法虽然对于 AccDNNs 是有效的，但在 AccDNNs 上引入了大量开销和延迟，使得它们不适合受能效约束的实时部署。为了解决这一问题，我们提出了一种名为 EPSILON 的轻量级框架，该框架利用预计算的统计签名和层间重要性度量，以高效的方式在 AxDNNs 中检测和缓解故障。我们的框架引入了一种新颖的非参数模式匹配算法，能够在不中断正常执行的同时进行常数时间故障检测，并且能够根据不同网络架构和故障模式动态适应。EPSILON 通过基于权重分布和层关键性的统计分析来智能调整缓解策略，同时保持近似计算的能效好处，从而保持模型的准确性。在不同近似乘法器、AxDNN 架构、流行数据集（MNIST、CIFAR-10、CIFAR-100、ImageNet-1k）以及故障场景下的广泛评估表明，EPSILON 在保持 80.05% 的准确性的同时，提供 22% 的推理时间改进和 28% 的能效改进，确立了 EPSILON 作为一种在安全关键边缘应用中部署可靠 AxDNN 的实用解决方案。