LLM2D
自适应单模调节以实现平衡多模信息获取
Adaptive Unimodal Regulation for Balanced Multimodal Information Acquisition
作者: Chengxiang Huang, Yake Wei, Zequn Yang, Di Hu
发布日期: 3/25/2025
arXiv ID: oai:arXiv.org:2503.18595v1

摘要

arXiv:2503.18595v1 类型: cross 摘要: 在早年对感觉进行训练对于人类发展至关重要。受这一认知现象的启发,我们观察到,在多模态学习过程中,早训练阶段也非常重要,此时数据集信息被迅速获取。我们将这一阶段称为关键学习窗口。然而,根据我们的观察,多模态学习中的关键学习窗口往往会由信息充足模态的信息所主导,从而抑制了信息不足模态的信息获取。为了解决这一问题,我们提出了一种名为信息获取调节(InfoReg)的方法,该方法旨在平衡各模态的信息获取。具体来说,InfoReg在关键学习窗口中减缓了信息充足模态的信息获取过程,这可能会促进信息不足模态的信息获取。这种调节有助于更平衡的学习过程,并提高多模态网络的总体性能。实验表明,InfoReg在各种数据集上优于相关多模态不平衡方法,实现了更好的模型性能。代码可在 https://github.com/GeWu-Lab/InfoReg_CVPR2025 获取。