摘要
近年来,一些研究调查了低精度累加,报告了跨各种平台的吞吐量、功耗和面积的改进。然而,伴随的提议只考虑了量化感知训练 (QAT) 范式,其中模型在循环中进行量化的情况下进行微调或从头开始训练。随着模型规模的不断增长,QAT 技术变得越来越昂贵,这促使了最近的训练后量化 (PTQ) 研究热潮。据我们所知,我们的研究标志着对 PTQ 设置中累加器感知量化的首次正式研究。为了弥合这一差距,我们引入了 AXE,这是一个实用的累加器感知扩展框架,旨在为现有的逐层 PTQ 算法提供溢出避免保证。我们从理论上论证了 AXE,并通过在两种最先进的 PTQ 算法 GPFQ 和 OPTQ 之上实现它来证明其灵活性。我们进一步推广了 AXE 以首次支持多级累加,为完整的数据路径优化和扩展到大型语言模型 (LLM) 打开了大门。我们在图像分类和语言生成模型上评估了 AXE,并观察到累加器位宽和模型精度之间的权衡比基线方法有了显著改进。