LLM2D

摘要

尽管深度网络在标准化视觉基准测试上的性能正在快速提升，但在现实世界的视觉任务中，它们仍然不如人类。这种看似矛盾的泛化能力不足可以通过使深度网络更像人脑来解决。虽然一些基准测试已经比较了深度网络预测人脑对自然图像反应的能力，但它们并没有捕捉到一些细微但重要的类脑涌现特性。为了解决这个问题，我们报告了几种可以用于测试深度网络的已知感知和神经涌现特性。为了评估各种设计因素如何影响类脑特性，我们系统地评估了30多个最先进的网络，这些网络具有不同的网络架构、训练数据集和训练方案。我们的主要发现如下：首先，与数据集和训练方案的变化相比，网络架构对类脑特性的影响最大。其次，网络在与人脑的一致性方面差异很大，没有哪个网络在所有方面都优于其他网络。总而言之，我们的结果通过揭示最先进的深度网络中存在的或缺乏的类脑特性，对现有的基准测试进行了补充。