摘要
arXiv:2504.08169v3 宣告类型: replace-cross
摘要:点击率(CTR)和转化率(CVR)的预测在广告推荐系统的成功中起着至关重要的作用。提出了一种深度分层集成网络(DHEN),通过整合多个特征交叉模块,已经在CTR预测方面取得了巨大成功。然而,在转化广告设置中,DHEN的CVR预测性能尚不清楚,转化广告通常是指广告主为用户在第三方网站或应用上的离站行为(如购买、加入购物车、注册等)出价。DHEN存在以下几个挑战:1)DHEN中应包含哪些特征交叉模块(如MLP、DCN、Transformer等)?2)DHEN应有多深和多宽才能在效率和效果之间实现最佳权衡?3)每个特征交叉模块应选择哪些超参数?输入个性化特征在模型性能上也具有较高的自由度,极大地影响了模型的表现。本文解决了这一问题,并从应用数据科学的角度提出我们的贡献,包括:首先,我们提出了一种多任务学习框架,以DHEN作为单一骨干模型架构来预测所有CVR任务,并详细研究了如何使DHEN在实践中有效工作;其次,我们建立了用于CVR预测的现场实时用户行为序列和离场转化事件序列,并进行了相关性分析以评估其重要性;最后但同样重要的是,我们提出了一个自监督辅助损失来预测输入序列中的未来行为,以帮助解决CVR预测中的标签稀疏问题。我们的方法在与预先训练的用户个性化特征的单个特征交叉模块相比时,取得了最先进的性能。