摘要
arXiv:2504.14356v1 宣告类型: 新
摘要: 本文提出了一个统一的混合整数规划框架,用于训练稀疏且可解释的神经网络。我们通过使用二进制变量建模非线性激活(如ReLU激活),并通过滤波器级别和层级别剪枝约束来编码结构稀疏性,为全连接和卷积架构开发了精确的公式。由此产生的模型将参数学习、架构选择和结构正则化融为一体,通过对预测准确性、权重稀疏性和架构紧凑性的目标进行权衡,得到全局最优解。混合整数规划公式可以容纳分段线性操作,包括最大池化和激活门控,并允许对基于逻辑或特定领域的约束进行精确的强制执行。通过直接将可解释性、稀疏性和可验证性考虑纳入训练过程,所提出框架弥合了可解释人工智能、符号推理和形式验证等多个研究领域的差距。