LLM2D

摘要

arXiv:2503.23630v1 类型: cross 摘要：推荐系统在封闭的反馈循环中运行，用户交互强化了流行度偏差，导致过度推荐已经流行的商品，同时减少对小众或新颖内容的展示。现有的偏差缓解方法，如逆权评分（IPS）和离策训练校正（OPC），主要在排名阶段或训练期间运行，缺乏对曝光动态的明确实时控制。在本工作中，我们引入了一种关注曝光的检索评分方法，该方法明确建模项目曝光概率，并在推理时调整检索阶段的排名。与前人的研究不同，该方法将曝光效果与参与可能性解耦，使大规模推荐平台能够在公平性和参与度之间进行可控的权衡。我们通过在实际视频推荐系统中的在线A/B实验验证了该方法，结果显示独特检索项目的增加比例为25%，过度流行内容的主导性降低40%，同时保持总体用户参与度。我们的研究表明，有一种可扩展且可部署的解决方案，可以在检索阶段缓解流行度偏差，提供了一种新的针对性偏差的个性化范式。