摘要
arXiv:2504.21772v1 类型: cross
摘要:类似 YouTube Shorts 和 TikTok 这样的短视频平台面临着显著的版权合规挑战,侵犯者经常嵌入随意的背景音乐(BGM),以掩盖原始声轨(OST)并逃避内容原创性检测。为了解决这一问题,我们提出了一种新颖的管道,将音乐源分离(MSS)和跨模态视频音乐检索(CMVMR)集成起来。我们的方法有效分离了随意的BGM与原始OST,使得恢复真实的视频音频轨道成为可能。为了支持这项工作,我们引入了两个领域专用的数据集:OASD-20K 用于音频分离和 OSVAR-160 用于管道评估。OASD-20K 包含 20,000 个包含混合 BGM 和 OST 的音频片段,而 OSVAR-160 是一个独特的基准数据集,包含 1,121 个带有混合音频的视频对,专门为短视频恢复任务设计。实验结果表明,我们的管道不仅以高精度消除了随意的 BGM,还恢复了原始声轨,确保了内容的完整性。这种方法为解决短视频平台上用户生成内容的版权挑战提供了一个道德且可扩展的解决方案。