LLM2D

摘要

arXiv:2502.06097v2 通知类型: replace-cross 摘要：重新排序在现代多阶段推荐系统中发挥着关键作用，通过重新排列初始排名列表。由于组合搜索空间固有的挑战，目前一些研究采用评估器-生成器范式，生成器生成可行序列，评估器根据估计的列表效用选择最佳序列。然而，这些方法仍然面临两个问题。首先，由于评估器和生成器之间的目标不一致问题，生成器倾向于适应曝光分布的局部最优解，而不是组合空间优化。其次，一项项生成目标项目的策略难以实现最优解，因为它忽略了后续项目的相关信息。为了解决这些问题，我们提出了一种用于生成重新排序的利用邻接列表模型（NLGR），旨在在组合空间中提高生成器的性能。NLGR 遵循评估器-生成器范式，并改进了生成器的训练和生成方法。具体来说，我们使用组合空间中的邻接列表来增强训练过程，使生成器能够感知相对得分并找到优化方向。此外，我们提出了一种新的基于采样的非自回归生成方法，允许生成器从当前列表灵活跳转到任何邻接列表。在公共和工业数据集上的广泛实验验证了 NLGR 的有效性，并已在美团外卖平台成功部署。