摘要
arXiv:2504.00957v1 类型: cross
摘要:随着对能量效率边缘AI系统的能源需求(例如,移动代理/机器人)的不断上升,神经形态计算的兴趣也随之增加,因为它通过神经形态处理器上的尖峰神经网络(SNN)算法提供了超低功耗/能效的AI计算。然而,这些高效实施策略尚未进行全面研究,从而限制了SNN部署在边缘AI系统中的应用。为此,我们提出了一种设计方法,以在商用神经形态处理器上实现高效的SNN处理。为此,我们首先研究了目标神经形态硬件的关键特征(例如,内存和计算预算),并利用这些信息进行网络选择的兼容性分析。然后,我们采用了一种映射策略,以在目标处理器上高效实现SNN。此外,我们纳入了一种高效的片上学习机制,以更新系统的知识,以适应新的输入类别和动态环境。实验结果表明,所提出的方法使得系统能够在不同的应用和场景中实现较低的推理延迟(例如,图像分类低于50ms,视频流中实时物体检测低于200ms,关键词识别低于1ms),以及较低的片上学习延迟(例如,关键词识别低于2ms),同时耗散的处理功率不到250mW,能效不到15mJ。这些结果表明,所提出的方法在实现具有多样应用场景的高效边缘AI系统方面的潜力。