LLM2D
超水平集与指数衰减:一种协同的稳定神经网络训练方法
Super Level Sets and Exponential Decay: A Synergistic Approach to Stable Neural Network Training
作者: Jatin Chaudhary, Dipak Nidhi, Jukka Heikkonen, Haari Merisaari, Rajiv Kanth
发布日期: 9/26/2024
arXiv ID: oai:arXiv.org:2409.16769v1

摘要

本文旨在通过开发一种有效整合指数衰减和先进反过拟合策略的动态学习率算法来增强神经网络的优化过程。我们的主要贡献是建立了一个理论框架,在这个框架中我们证明了在我们的算法影响下,优化景观表现出独特的稳定性特征,这些特征由李雅普诺夫稳定性原理定义。具体来说,我们证明了受自适应学习率影响的损失函数的超水平集始终是连通的,确保了一致的训练动态。此外,我们建立了这些超水平集的“等连通性”属性,该属性在不同的训练条件和时期保持一致的稳定性。本文为神经网络中动态学习率机制的理论理解做出了贡献,也为开发更有效、更可靠的神经优化技术铺平了道路。本研究旨在将损失函数作为超水平集在神经网络训练中的等连通性形式化和验证,为自适应机器学习算法的未来研究开辟新的途径。我们利用之前的理论发现来提出训练机制,可以有效地处理复杂和高维数据景观,特别是在需要高精度和可靠性的应用中。