摘要
arXiv:2503.20428v1 声明类型:交叉
摘要:本研究探讨了广泛使用的面部表情识别(FER)数据集在训练深度学习模型时的关键特性和适用性。在情感计算领域,面部表情识别对于解读人类情感至关重要,但FER系统的性能高度依赖于底层数据集的质量和多样性。为了解决这一问题,我们汇总并分析了24个FER数据集,包括针对特定年龄段的人群,如儿童、成人和老年人的数据集,并通过全面的标准化流程进行了处理。此外,我们还为这些数据集增加了自动标注的年龄和性别信息,从而使对其人口统计特性的评估更加细致。为进一步评估数据集的有效性,我们引入了三个新的度量标准:局部相似性、全局相似性和配对相似性,这些标准定量地衡量了数据集的难度、泛化能力和跨数据集的迁移性。使用最先进的神经网络进行基准实验表明,大规模、自动收集的数据集(例如AffectNet、FER2013)在泛化能力上表现较好,尽管存在标签噪声和人口统计偏差的问题,而受控数据集则提供了更高的标注质量,但变量较少。我们的研究结果为数据集的选择和设计提供了可操作的建议,推动了更稳健、公平和有效的FER系统的开发。