LLM2D

摘要

arXiv:2504.14356v1 宣告类型: 新摘要: 本文提出了一个统一的混合整数规划框架，用于训练稀疏且可解释的神经网络。我们通过使用二进制变量建模非线性激活（如ReLU激活），并通过滤波器级别和层级别剪枝约束来编码结构稀疏性，为全连接和卷积架构开发了精确的公式。由此产生的模型将参数学习、架构选择和结构正则化融为一体，通过对预测准确性、权重稀疏性和架构紧凑性的目标进行权衡，得到全局最优解。混合整数规划公式可以容纳分段线性操作，包括最大池化和激活门控，并允许对基于逻辑或特定领域的约束进行精确的强制执行。通过直接将可解释性、稀疏性和可验证性考虑纳入训练过程，所提出框架弥合了可解释人工智能、符号推理和形式验证等多个研究领域的差距。