摘要
arXiv:2410.13117v2 宣布类型: 交叉替换
摘要:推荐系统根据从历史行为数据中推导出的用户偏好分布来预测个性化项目排名。最近,扩散模型(DMs)因其能够建模复杂的分布而受到推荐领域的关注,但当前基于DM的推荐系统往往依赖于传统的目标函数,如均方误差(MSE)或推荐目标,这些目标函数并未针对个性化排名任务进行优化,或者未能充分利用DM的生成潜力。为了解决这一问题,我们提出了一种名为PreferDiff的针对基于DM的推荐系统的定制优化目标。PreferDiff将BPR转化为一个概率似然排序目标,并结合了多个负样本以更好地捕捉用户偏好。具体而言,我们利用变分推断来通过最小化变分上界来处理不可计算性,并用余弦误差替换MSE以提高与推荐任务的对齐度。最后,我们平衡生成学习和偏好学习以增强DM的训练稳定性。PreferDiff提供了三个关键优势:它是第一个专门为基于DM的推荐系统设计的个性化排名损失函数,通过处理困难的负样本可以提高排名性能和更快的收敛速度。我们还证明它与直接偏好优化在理论上存在联系,这意味着它有可能通过生成建模来对齐基于DM的推荐系统中的用户偏好。在三个基准上的广泛实验验证了其优越的推荐性能和良好的序列推荐泛化能力。我们的代码可在https://github.com/lswhim/PreferDiff获取。