摘要
arXiv:2504.20634v1 分类:交叉学科
摘要:大规模数值计算越来越多地使用低精度(LP)浮点格式和混合精度算术,可以通过随机舍入(SR)技术加以增强,即根据值与两个舍入候选值之间的距离,随机向上或向下舍入中间的高精度值。随机舍入除了需要高精度输入值外,还需要随机位的来源。由于提供高质量的随机位会增加额外的计算成本,因此,在保持给定计算或计算领域中SR的 desirable 属性的同时,需要尽可能减少所需的位数是一个有趣的问题。本文探讨了几种可能的少量位随机舍入(FBSR)的实现,并展示了几种自然实现有时会引入显著的偏差,而在无限位、无限精度的实现检查中,这些偏差并不存在。本文研究了这些偏差对机器学习示例的影响,从而为开发或采用低精度浮点数的实践者打开了另一类配置参数。代码可在 http://github.com/graphcore-research/arith25-stochastic-rounding 获取。