摘要
神经科学和人工智能 (AI) 都面临着解释高维神经数据的挑战,而这类数据的比较分析对于揭示这些复杂系统之间共享的机制和差异至关重要。尽管表征比较被广泛使用,并且存在大量的比较方法,但一个关键问题仍然存在:哪些指标最适合这些比较?一些研究根据指标区分不同来源或结构模型(例如,各种架构)的能力来评估指标,另一种方法是评估它们区分表现出不同行为的模型的能力。为了研究这个问题,我们利用群体统计和一套全面的行为指标进行比较,检查各种表征相似性度量与行为结果之间的一致性程度。在我们对视觉领域中常用的八种表征相似性度量(包括基于比对的、基于典型相关分析 (CCA) 的、基于内积核的和基于最近邻的方法)的评估中,我们发现像线性中心核比对 (CKA) 和普罗克拉斯距离这样的度量,它们强调表征的整体几何结构或形状,在区分训练模型和未训练模型以及与行为测量结果保持一致方面表现出色,而像线性预测性这样的度量(在神经科学中常用)仅表现出与行为适度的一致性。这些见解对于选择强调神经人工智能研究中行为上有意义的比较的指标至关重要。