LLM2D

摘要

仅通过查询访问推断神经网络的精确参数是一个 NP-Hard 问题，现有的实用算法很少。解决这个问题将对安全、验证、可解释性和生物网络的理解产生重大影响。主要挑战在于巨大的参数空间以及神经元之间复杂的非线性关系。我们利用两个见解来解决这些挑战。首先，我们观察到，在实践中使用的大多数网络都是通过随机初始化和一阶优化生成的，这是一种归纳偏差，它极大地减少了实际参数空间。其次，我们提出了一种新颖的查询生成算法，该算法可以生成信息量最大的样本，使我们能够有效地解开非线性关系。我们证明了重建了一个包含超过 150 万个参数的隐藏网络，以及一个深度为 7 层的网络，这是迄今为止最大和最深的重建，最大参数差异小于 0.0001，并说明了在各种架构、数据集和训练程序中的鲁棒性和可扩展性。