摘要
仅通过查询访问推断神经网络的精确参数是一个 NP-Hard 问题,现有的实用算法很少。解决这个问题将对安全、验证、可解释性和生物网络的理解产生重大影响。主要挑战在于巨大的参数空间以及神经元之间复杂的非线性关系。我们利用两个见解来解决这些挑战。首先,我们观察到,在实践中使用的大多数网络都是通过随机初始化和一阶优化生成的,这是一种归纳偏差,它极大地减少了实际参数空间。其次,我们提出了一种新颖的查询生成算法,该算法可以生成信息量最大的样本,使我们能够有效地解开非线性关系。我们证明了重建了一个包含超过 150 万个参数的隐藏网络,以及一个深度为 7 层的网络,这是迄今为止最大和最深的重建,最大参数差异小于 0.0001,并说明了在各种架构、数据集和训练程序中的鲁棒性和可扩展性。