LLM2D

摘要

arXiv:2502.03359v2 公告类型: replace-cross 摘要：大规模识别方法的评估通常侧重于整体性能。虽然这种方法很常见，但它往往无法提供对各个类别的性能 insight，这可能导致公平性问题和误代表性。解决这些差距对于准确评估方法在处理新型或未见过的类别时的效果以及确保公平评估至关重要。为了解决开集识别（OSR）中的公平性问题，我们展示了类别间性能可以有显著差异。我们引入了一种称为高斯假设开集技术（GHOST）的新颖无超参数算法，该算法使用具有对角协方差矩阵的类别内多元高斯分布来建模深层特征。我们对logits应用Z分数归一化，以减轻特征幅度偏离模型预期的影响，从而减少网络将高分分配给未知样本的可能性。我们在多个预训练的ImageNet-1K 深度网络上评估了GHOST，并用四个不同的未知数据集对其进行测试。通过使用标准指标如AUOSCR、AUC和FPR95，我们在大规模OSR领域取得了统计显著的改进。提供了在线源代码。