摘要
arXiv:2504.08771v1 交叉公告类型
摘要:本文介绍了一种新的模型来生成短视频推荐的浏览过程,并提出了通过用户互动反馈的片段内容感知模型(SCAM),用于视频推荐中的观看时间预测。与现有的方法依赖多模态特征来理解视频内容不同,SCAM 通过用户的 histórico 观看行为隐式地建模视频内容,使段级理解能够在不使用复杂多模态数据的情况下实现。通过根据持续时间将视频划分为片段,并采用类似 Transformer 的架构,SCAM 捕捉了片段之间的序列依赖性,同时减轻了持续时间偏差。在工业规模和公开数据集上的广泛实验表明,SCAM 在观看时间预测方面的性能处于领先地位。提出的这种方法通过利用段级建模和用户互动反馈提供了一种可扩展且有效的视频推荐解决方案。