LLM2D

摘要

arXiv:2502.10284v1 声明类型: cross 摘要: 大规模推荐系统通常采用检索、预排序、排序和再排序的级联架构。由于存在严格的时间延迟要求，预排序利用轻量级模型对大量检索候选项进行初步筛选。然而，近期的工作仅专注于提高与排序的一致性，完全依赖下游阶段。由于下游输入来源于预排序输出，这将加剧样本选择偏差（SSB）问题和Matthew效应，导致次优化的结果。为了解决这一局限性，我们提出了一个名为Hybrid Cross-Stage Coordination Pre-ranking模型（HCCP）的新颖模型，以整合来自上游（检索）和下游（排序、再排序）阶段的信息。具体而言，跨阶段协调指的是预排序在整个流中的适应性和作为连接上游和下游更有效的桥梁的作用。HCCP包括杂合样本构建和杂合目标优化。杂合样本构建从整个流中捕获多级未暴露的数据，并重新排列以成为预排序学习的最佳引导“ground truth”。杂合目标优化通过我们提出的Margin InfoNCE损失实现了置信度和长尾精度的联合优化。它特别设计用于从这样的杂合未暴露样本中学习，提高整体性能并减轻SSB问题。附录描述了所提损失在选择潜在正样本方面的有效性证明。广泛的离线和在线实验表明，HCCP通过提高跨阶段协调优于现有的领先方法。在JD电子商务推荐系统中，它贡献了14.9%的UCVR和1.3%的UCTR。关于代码隐私，我们提供了参考用的伪代码。