LLM2D
FAS: 快速ANN-SNN转换以构建大规模神经拟态语言模型
FAS: Fast ANN-SNN Conversion for Spiking Large Language Models
作者: Long Chen, Xiaotian Song, Andy Song, BaDong Chen, Jiancheng Lv, Yanan Sun
发布日期: 5/15/2025
arXiv ID: oai:arXiv.org:2502.04405v2

摘要

arXiv:2502.04405v2 宣告类型: replace-cross 摘要:脉冲大规模语言模型已在各种场景中展示了其作为LLM的良好替代方案。现有方法创建脉冲LLM的方法,即直接训练和ANN-SNN转换,通常会导致性能下降和相对较高的计算成本。为了解决这些问题,我们提出了一种新颖的快速ANN-SNN转换策略(FAS),该策略分两阶段将LLM转换为脉冲LLM。第一阶段采用全参数微调预训练模型,因此不需要从头开始的直接训练。第二阶段引入一种粗到细的校准方法,以减少转换错误并提高准确性。在不同规模的LLM的自然语言和视觉语言任务上的实验表明,FAS可以实现最先进的性能,同时具有显著降低的推理延迟和计算成本。值得注意的是,FAS只需八步就实现了比OPT-7B模型高3%的准确性,同时降低了96.63%的能源消耗。源代码可在https://github.com/lc783/FAS获取。