LLM2D

摘要

arXiv:2502.05695v1 通告类型：交叉摘要：本文提出了一种通过在FFmpeg技术中整合潜在扩散模型（LDMs）的新颖框架，以实现实时自适应比特率视频流传输。该解决方案解决了传统恒定比特率流传输（CBS）和自适应比特率流传输（ABS）相关联的高带宽使用、存储效率低下以及体验质量（QoE）下降的挑战。所提出的方案利用LDMs将I-帧压缩到潜在空间，提供显著的存储和语义传输节省，同时不牺牲高视觉质量。尽管保留了B-帧和P-帧作为调整元数据以确保用户侧高效的视频重建，但该提出的框架还与最先进的去噪和视频帧插值（VFI）技术相结合。这些技术减轻了语义不确定性，即使在嘈杂的无线通信环境中也能恢复帧之间的时序一致性。实验结果表明，所提出的方法能够以优化的带宽使用实现高质量的视频流传输，在体验质量和资源效率方面优于最先进的解决方案。这项工作为5G及未来后5G网络中的可扩展实时视频流传输开启了新的可能性。