摘要
arXiv:2502.10089v1 交叉类型:cross
摘要:近年来,智能边缘计算系统的发展势头日益增强,这些系统旨在本地处理信息。许多接近传感器的机器学习(ML)方法已被实施,以在资源受限的边缘感知系统(例如可穿戴设备)中引入准确且节能的模板匹配操作。为了引入适用于极端边缘情况的新解决方案,已经开始提出结合传统技术和新兴技术的混合解决方案。针对边缘应用优化的深度神经网络(DNN)以及在设备和架构层面的新计算方法,可能成为实施竞争性准确分类的边缘ML解决方案的有力候选者,同时使用常规ML解决方案一小部分的电力。在本工作中,我们提出了一个旨在服务于极端边缘附近传感器系统的混合软硬件边缘分类器。该分类器由两部分组成:(i) 一个优化的数字极简ML网络,作为前端特征提取器,(ii) 一个后端的RRAM-CMOS模拟内容可寻址存储器(ACAM),作为最终阶段的模板匹配系统。该混合系统在准确性和能量效率之间表现出可竞争的权衡,每分类操作的前端能耗 \(E_{front-end}\) 为 96.23 nJ,后端能耗 \(E_{back-end}\) 为 1.45 nJ,相比之下,原教师模型的能耗为 78.06 μJ,能耗降低了 792 倍,使其成为极端边缘应用的可行解决方案。