摘要
arXiv:2502.06736v1 通知类型: 交叉
摘要: 本文介绍了一种基于尖峰神经网络(SNNs)的尖峰事件可穿戴分析系统,这些SNNs部署在一个基于RRAM交叉阵列的内置计算引擎上,后者以其紧凑性和能效而闻名。鉴于底层RRAM交叉阵列的硬件限制和噪声特性,我们提出了一种实时在线调整预训练SNNs的方法,使用直接反馈对齐(DFA)替代传统的反向传播(BP)。直接反馈对齐(DFA)学习能够在层级并行梯度计算,作为在RRAM交叉阵列上在线调整SNNs的一种快速且能效和面积高效的方 法,与使用BP进行调整相比,能获得更好的算法性能。通过使用我们内部的硬件评估引擎DFA_Sim进行广泛的仿真,我们发现DFA相比于BP实现了最多64.1%的能耗降低、10.1%的面积增益,并且延迟减少了2.1倍,同时在人类活动识别(HAR)任务上的推断准确性提高了最多7.55%。