摘要
arXiv:2504.00957v2 宣布类型: 替换-交叉引用
摘要:对能效边缘AI系统(例如,移动代理/机器人)的需求日益增长,增加了对类脑计算的兴趣,因为它可以通过类脑处理器上的尖峰神经网络(SNN)算法提供超低功耗/能量的AI计算。然而,对其有效的实现策略尚未进行全面研究,因此限制了SNN在边缘AI系统中的部署。为此,我们提出了一种设计方法,以在通用类脑处理器上实现高效的SNN处理。为此,我们首先研究目标类脑硬件的关键特性(例如,内存和计算预算),并利用这些信息进行网络选择的兼容性分析。之后,我们采用一种映射策略,以在目标处理器上高效实现SNN。此外,我们整合了一种高效的片上学习机制,以更新系统的知识,适应新的输入类别和动态环境。实验结果表明,所提出的方法使系统能够实现较低的推理延迟(例如,图像分类小于50毫秒,视频流中实时对象检测小于200毫秒,关键词识别小于1毫秒)和较低的片上学习延迟(例如,关键词识别小于2毫秒),同时功耗低于250毫瓦,能耗低于15毫焦尔,适用于不同的应用程序和场景。这些结果表明,所提出的方法在实现多样化的边缘AI系统应用方面具有潜力。