摘要
推荐系统 (RS) 常常受到流行度偏差的困扰。当在通常长尾分布的数据集上训练推荐模型时,模型不仅会继承这种偏差,而且往往会加剧这种偏差,导致推荐列表中流行项目的过度表示。本研究进行了全面的实证和理论分析,以揭示这种现象的根本原因,得出两个核心见解:1)项目流行度被记忆在推荐模型预测的评分矩阵的主谱中;2)维度坍缩现象放大了主谱的相对突出性,从而加剧了流行度偏差。基于这些见解,我们提出了一种新颖的去偏差策略,该策略利用谱范数正则化器来惩罚主奇异值的幅度。我们开发了一种高效的算法,通过利用评分矩阵的光谱特性来加快谱范数的计算。我们在七个真实世界的数据集和三个测试范例上进行了大量的实验,以验证所提出方法的优越性。