LLM2D

摘要

arXiv:2403.03993v2 通知类型: 替换-交叉摘要：推荐系统已成为在线平台的重要组成部分。每天的训练数据量不断增加，用户的交互数量也在持续增长。探索更大、更表达能力强的模型已成为提高用户体验的必要追求。然而，这种进步伴随着更大的计算负担。在商业环境中，一旦训练并部署了推荐系统模型，通常需要频繁更新以适应新的客户端数据。随着时间的积累，数据量的增长最终会使得从头开始进行全面批量重新训练变得在计算上不可行。仅仅在新数据上进行平滑微调遇到了众所周知的灾难性遗忘问题。尽管负采样是使用隐式反馈训练过程中的关键部分，但尚不存在专门针对增量学习框架的技术。在本工作中，我们提出了一种个性化的负采样水库策略，用于图推荐系统中的标准三元损失获取负样本。我们的技术通过鼓励模型记住稳定的用户偏好，并在用户兴趣发生变化时有选择地遗忘，平衡了遗忘缓解与灵活性。我们推导了负采样器的数学公式来填充和更新水库。我们将我们的设计集成到了三个最先进和常用增量推荐模型中。我们展示了我们的负水库框架的具体实现，在多种top-k评价值标准下达到标准基准的最先进结果。