摘要
arXiv:2502.06097v2 通知类型: replace-cross
摘要:重新排序在现代多阶段推荐系统中发挥着关键作用,通过重新排列初始排名列表。由于组合搜索空间固有的挑战,目前一些研究采用评估器-生成器范式,生成器生成可行序列,评估器根据估计的列表效用选择最佳序列。然而,这些方法仍然面临两个问题。首先,由于评估器和生成器之间的目标不一致问题,生成器倾向于适应曝光分布的局部最优解,而不是组合空间优化。其次,一项项生成目标项目的策略难以实现最优解,因为它忽略了后续项目的相关信息。
为了解决这些问题,我们提出了一种用于生成重新排序的利用邻接列表模型(NLGR),旨在在组合空间中提高生成器的性能。NLGR 遵循评估器-生成器范式,并改进了生成器的训练和生成方法。具体来说,我们使用组合空间中的邻接列表来增强训练过程,使生成器能够感知相对得分并找到优化方向。此外,我们提出了一种新的基于采样的非自回归生成方法,允许生成器从当前列表灵活跳转到任何邻接列表。在公共和工业数据集上的广泛实验验证了 NLGR 的有效性,并已在美团外卖平台成功部署。