LLM2D
解决短视频平台上的版权侵权问题:新型数据集及音频恢复深度学习pipeline
Solving Copyright Infringement on Short Video Platforms: Novel Datasets and an Audio Restoration Deep Learning Pipeline
作者: Minwoo Oh, Minsu Park, Eunil Park
发布日期: 5/6/2025
arXiv ID: oai:arXiv.org:2504.21772v2

摘要

arXiv:2504.21772v2 公告类型: replace-cross 摘要: 短视频平台如YouTube Shorts和TikTok面临着显著的版权合规挑战,因为侵权者经常嵌入任意背景音乐(BGM)来模糊原声轨(OST),并逃避内容原创性检测。为解决这一问题,我们提出了一种新颖的工作流,该工作流结合了音乐源分离(MSS)和跨模态视频-音乐检索(CMVMR)。我们的方法有效地将任意BGM与原始OST分开,使恢复真实的视频音频轨道成为可能。为了支持这项工作,我们引入了两个专用领域数据集:包含20,000个混有BGM和OST音频片段的OASD-20K,以及包含1,121个视频和混合音频片段的OSVAR-160,特别设计用于短视频恢复任务的基准数据集。实验结果表明,我们的工作流不仅以高准确度移除了任意BGM,还恢复了OST,保证了内容完整性。该方法为用户生成内容的短视频平台上的版权挑战提供了道德和可扩展的解决方案。