摘要
arXiv:2502.05695v1 通告类型:交叉
摘要:本文提出了一种通过在FFmpeg技术中整合潜在扩散模型(LDMs)的新颖框架,以实现实时自适应比特率视频流传输。该解决方案解决了传统恒定比特率流传输(CBS)和自适应比特率流传输(ABS)相关联的高带宽使用、存储效率低下以及体验质量(QoE)下降的挑战。所提出的方案利用LDMs将I-帧压缩到潜在空间,提供显著的存储和语义传输节省,同时不牺牲高视觉质量。尽管保留了B-帧和P-帧作为调整元数据以确保用户侧高效的视频重建,但该提出的框架还与最先进的去噪和视频帧插值(VFI)技术相结合。这些技术减轻了语义不确定性,即使在嘈杂的无线通信环境中也能恢复帧之间的时序一致性。实验结果表明,所提出的方法能够以优化的带宽使用实现高质量的视频流传输,在体验质量和资源效率方面优于最先进的解决方案。这项工作为5G及未来后5G网络中的可扩展实时视频流传输开启了新的可能性。