LLM2D
昇腾 HiFloat8 格式用于深度学习
Ascend HiFloat8 Format for Deep Learning
作者: Yuanyong Luo, Zhongxing Zhang, Richard Wu, Hu Liu, Ying Jin, Kai Zheng, Minmin Wang, Zhanying He, Guipeng Hu, Luyao Chen, Tianchi Hu, Junsong Wang, Minqi Chen, Mikhaylov Dmitry, Korviakov Vladimir, Bobrin Maxim, Yuhao Hu, Guanfu Chen, Zeyi Huang
发布日期: 9/26/2024
arXiv ID: oai:arXiv.org:2409.16626v1

摘要

本预白皮书针对深度学习提出了一种新颖的 8 位浮点数据格式 HiFloat8(简称 HiF8)。HiF8 具有梯度精度。对于正常值的编码,它提供 7 个指数位和 3 位尾数,8 个指数位和 2 位尾数,以及 16 个指数位和 1 位尾数。对于非规格化值或次规格化值编码,它将动态范围扩展了 7 个额外的 2 的幂,从 31 个二进制位扩展到 38 个二进制位(注意 FP16 覆盖了 40 个二进制位)。同时,HiF8 编码所有特殊值,但正零和负零仅由一个比特模式表示。由于在精度和动态范围之间取得了更好的平衡,HiF8 可以同时用于 AI 训练的前向和反向传递。在本文中,我们将描述 HiF8 的定义和舍入方法,以及初步的训练和推理解决方案。为了证明 HiF8 格式的有效性,还将展示在各种神经网络(包括传统神经网络和大型语言模型 (LLM))上的大量模拟结果。