LLM2D
基于领域自适应的广告排序模型反事实评估
Counterfactual Evaluation of Ads Ranking Models through Domain Adaptation
作者: Mohamed A. Radwan, Himaghna Bhattacharjee, Quinn Lanners, Jiasheng Zhang, Serkan Karakulak, Houssam Nassif, Murat Ali Bayir
发布日期: 10/1/2024
arXiv ID: oai:arXiv.org:2409.19824v1

摘要

我们提出了一种领域自适应奖励模型,该模型与离线 A/B 测试系统协同工作,用于评估排序模型。这种方法有效地衡量了大型广告推荐系统中排序模型变化的奖励,而像 IPS 这样的无模型方法在这些系统中不可行。我们的实验表明,所提出的技术优于原始 IPS 方法和使用非泛化奖励模型的方法。