LLM2D
具有普遍逼近保证的硬约束神经网络
Hard-Constrained Neural Networks with Universal Approximation Guarantees
作者: Youngjae Min, Navid Azizan
发布日期: 5/6/2025
arXiv ID: oai:arXiv.org:2410.10807v2

摘要

arXiv:2410.10807v2 宣告类型: 替换交叉 摘要:将先验知识或输入输出关系的规范融入机器学习模型已获得广泛关注,这有助于从有限数据中进行泛化,并产生符合要求的输出。然而,大多数现有方法通过正则化惩罚违反约束来使用软约束,这无法提供约束满足的保证——这是安全关键应用中的一个基本要求。另一方面,在神经网络上施加硬约束可能会影响其表示能力,从而不利地影响性能。为了解决这一问题,我们提出了一种名为HardNet的实用框架,该框架可以在不牺牲模型容量的情况下使神经网络本身满足硬约束。与仅在推断时修改输出的方法不同,HardNet允许在具有一致硬约束保证的情况下端到端训练,从而提高性能。据我们所知,HardNet是第一种具有高效前向传播来强制执行多个输入依赖不等式约束的方法。通过在网络输出后附加一个可微闭式强制层,它允许使用标准算法对网络参数进行未约束优化。此外,我们展示了HardNet保留了神经网络的通用逼近能力。我们展示了HardNet在各种应用中的通用性和有效性,包括有分段约束的学习、优化求解器的学习、在安全关键系统中优化控制策略和在航空系统中学习安全决策逻辑。