LLM2D
HM-DF SNN: 超越传统在线学习的高级训练与部署
HM-DF SNN: Transcending Conventional Online Learning with Advanced Training and Deployment
作者: Zecheng Hao, Yifan Huang, Zijie Xu, Wenxuan Liu, Yuanhong Tang, Zhaofei Yu, Tiejun Huang
发布日期: 5/8/2025
arXiv ID: oai:arXiv.org:2410.07547v2

摘要

arXiv:2410.07547v2 更新类型: replace-cross 摘要:脉冲神经网络(SNNs)被认为由于其仿脑性和能效性,在未来的人工智能发展中具有巨大的潜力。与传统的时空反向传播(STBP)训练方法相比,在线训练可以有效克服GPU内存爆炸的风险。然而,当前的在线学习框架无法解决时间依赖梯度的不可分问题,并仅仅旨在优化训练内存,导致在推理阶段性能不及STBP训练模型。为了解决上述挑战,我们提出了混合机制驱动放电(HM-DF)模型,这是一个采用不同脉冲计算方案的高级模型;在放电阈值的上下区域分别采用了不同的放电策略。我们指出,HM-DF模型可以有效分离时间梯度、解决近似梯度的不匹配问题,并在计算速度和内存占用方面实现全过程优化。实验结果表明,HM-DF模型可以灵活结合各种技术,在在线学习领域实现尖端性能,而不引发进一步的能耗。