LLM2D
偏微分方程是生成神经网络架构的全部所需——物理人工智能系统的理论
Partial Differential Equations is All You Need for Generating Neural Architectures -- A Theory for Physical Artificial Intelligence Systems
作者: Ping Guo, Kaizhu Huang, Zenglin Xu
发布日期: 10/11/2024
arXiv ID: oai:arXiv.org:2103.08313v2

摘要

在这项工作中,我们将统计物理学中的反应扩散方程、量子力学中的薛定谔方程、近轴光学中的亥姆霍兹方程推广到神经偏微分方程 (NPDE),它可以被认为是人工智能研究领域的基石。我们采用有限差分法对 NPDE 进行离散化以求解数值解,并生成了深度神经网络架构的基本构建块,包括多层感知器、卷积神经网络和循环神经网络。还介绍了学习策略,例如自适应矩估计、L-BFGS、伪逆学习算法和偏微分方程约束优化。我们认为,呈现可解释的深度神经网络的清晰物理图像具有重要意义,这使得它可以应用于模拟计算设备设计,并为物理人工智能铺平道路。