LLM2D
AdamZ:一种改进的神经网络训练优化方法
AdamZ: An Enhanced Optimisation Method for Neural Network Training
作者: Ilia Zaznov (Department of Computer Science, University of Reading, Reading, UK), Atta Badii (Department of Computer Science, University of Reading, Reading, UK), Alfonso Dufour (ICMA Centre, Henley Business School, University of Reading, Reading, UK), Julian Kunkel (Department of Computer Science/GWDG, University of G\"ottingen, Goettingen, Germany)
发布日期: 11/26/2024
arXiv ID: oai:arXiv.org:2411.15375v1

摘要

AdamZ是Adam优化器的一种改进版本,旨在提高神经网络训练的收敛效率。该优化器通过结合解决优化过程中常见过冲和停滞问题的机制来动态调整学习率。具体来说,AdamZ在检测到过冲时降低学习率,在停滞期间提高学习率,并利用超参数(例如过冲和停滞因子、阈值和耐心级别)来指导这些调整。虽然与其他一些优化器相比,AdamZ可能会导致略长的训练时间,但它始终在最小化损失函数方面表现出色,这使其在精度至关重要的应用中特别有利。基准测试结果证明了AdamZ在保持最佳学习率方面的有效性,从而提高了各种任务的模型性能。