LLM2D

摘要

arXiv:2502.04405v1 类型: cross 摘要: 静态脉冲大语言模型在各种场景中被证明是大语言模型（LLMs）的很好替代方案。现有的创建静态脉冲大语言模型（Spiking LLMs）的方法，即直接训练和ANN-SNN转换，往往面临着性能下降和相对较高的计算成本问题。为了解决这些问题，我们提出了一种新的快速ANN-SNN转换策略（FAS），该策略通过两个阶段将LLMs转换为脉冲LLMs。第一阶段使用预训练模型的全参数微调，因此不需要从头开始的直接训练。第二阶段引入了一种粗到细的校准方法，以减少转换错误和提高准确性。我们在不同规模的LLMs上的语言和跨模态任务实验中证明，FAS可以在显著降低推理延迟和计算成本的同时实现最先进的性能。例如，FAS只需8个时间步就可以实现比OPT-7B模型高3%的准确率，同时减少能耗96.63%。