摘要
arXiv:2504.06609v1 Announce Type: cross
摘要:现代搜索引擎采用多阶段架构以高效地提供个性化结果。关键阶段包括检索、预排序、全排序和融合,这些阶段将数十亿个项目细化为最佳选择。预排序阶段对于在评分和过滤数十万个项目到几千个项目的任务中至关重要,尽管通常缺乏捕捉复杂交互的能力,但它在很大程度上依赖于两种塔模型以实现计算效率。虽然查询-项目交叉交互特征对于全排序至关重要,但将它们整合到预排序模型中会面临效率相关的挑战。在本文中,我们引入了InteractRank,这是一种基于Pinterest的新颖两塔预排序模型,它在预排序模型中使用了稳健的交叉交互特征。通过在评分函数中结合基于历史用户参与的查询-项目交互以及两塔点积,InteractRank在保持低延迟和计算成本的情况下显著提高了预排序性能。在Pinterest的实际A/B实验中,与BM25基准相比,InteractRank将在线参与度指标提高了6.5%,与基础的两塔模型相比则提高了3.7%。我们还强调了InteractRank的其他组成部分,例如实时用户序列建模,并通过离线裁剪研究分析了它们的贡献。InteractRank的代码可在https://github.com/pinterest/atg-research/tree/main/InteractRank 获取。