摘要
arXiv:2503.23630v1 类型: cross
摘要:推荐系统在封闭的反馈循环中运行,用户交互强化了流行度偏差,导致过度推荐已经流行的商品,同时减少对小众或新颖内容的展示。现有的偏差缓解方法,如逆权评分(IPS)和离策训练校正(OPC),主要在排名阶段或训练期间运行,缺乏对曝光动态的明确实时控制。在本工作中,我们引入了一种关注曝光的检索评分方法,该方法明确建模项目曝光概率,并在推理时调整检索阶段的排名。与前人的研究不同,该方法将曝光效果与参与可能性解耦,使大规模推荐平台能够在公平性和参与度之间进行可控的权衡。我们通过在实际视频推荐系统中的在线A/B实验验证了该方法,结果显示独特检索项目的增加比例为25%,过度流行内容的主导性降低40%,同时保持总体用户参与度。我们的研究表明,有一种可扩展且可部署的解决方案,可以在检索阶段缓解流行度偏差,提供了一种新的针对性偏差的个性化范式。