LLM2D
渐进多源领域适应的个性化面部表情识别
Progressive Multi-Source Domain Adaptation for Personalized Facial Expression Recognition
作者: Muhammad Osama Zeeshan, Marco Pedersoli, Alessandro Lameiras Koerich, Eric Grange
发布日期: 4/8/2025
arXiv ID: oai:arXiv.org:2504.04252v1

摘要

arXiv:2504.04252v1 类别: cross 摘要: 个性化面部表情识别(FER)涉及使用标记来源和未标记目标域的样本来适应机器学习模型。鉴于识别细微表情并考虑到个体之间差异的挑战,最先进的无监督域适应(UDA)方法集中于多源UDA(MSDA)设置,每个域对应特定的主体,并提高模型准确性和鲁棒性。然而,在适应特定目标时,多个源域的多样性导致源数据与目标数据之间存在显著的数据迁移。针对FER的最先进的MSDA方法通过考虑所有源来适应目标表示来解决这一域迁移问题。然而,适应特定目标主体带来了巨大挑战,因为源域和目标域之间的分布差异通常会导致负迁移。此外,同时整合所有源会增加计算成本并导致与目标的不匹配。为解决这些问题,我们提出了一种渐进的MSDA方法,该方法根据与目标主体的相似性逐步引入信息。这将确保仅选择与目标最相关的源,从而避免由不相似源导致的负迁移。我们首先利用与目标最接近的源来减少与目标的数据迁移,然后逐渐转向最远的源,同时仅考虑基于预设阈值的最相关的源。此外,为了缓解逐步引入源主体导致的灾难性遗忘,我们实现了一种基于密度的记忆机制,保留了适应所需的最相关的历史源样本。我们的实验展示了我们提出的方法在疼痛数据集:Biovid和UNBC-McMaster上的有效性。