LLM2D
基于潜在扩散模型的语义感知自适应视频流传技术在无线网络中的应用
Semantic-Aware Adaptive Video Streaming Using Latent Diffusion Models for Wireless Networks
作者: Zijiang Yan, Jianhua Pei, Hongda Wu, Hina Tabassum, Ping Wang
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2502.05695v1

摘要

arXiv:2502.05695v1 通告类型:交叉 摘要:本文提出了一种通过在FFmpeg技术中整合潜在扩散模型(LDMs)的新颖框架,以实现实时自适应比特率视频流传输。该解决方案解决了传统恒定比特率流传输(CBS)和自适应比特率流传输(ABS)相关联的高带宽使用、存储效率低下以及体验质量(QoE)下降的挑战。所提出的方案利用LDMs将I-帧压缩到潜在空间,提供显著的存储和语义传输节省,同时不牺牲高视觉质量。尽管保留了B-帧和P-帧作为调整元数据以确保用户侧高效的视频重建,但该提出的框架还与最先进的去噪和视频帧插值(VFI)技术相结合。这些技术减轻了语义不确定性,即使在嘈杂的无线通信环境中也能恢复帧之间的时序一致性。实验结果表明,所提出的方法能够以优化的带宽使用实现高质量的视频流传输,在体验质量和资源效率方面优于最先进的解决方案。这项工作为5G及未来后5G网络中的可扩展实时视频流传输开启了新的可能性。