摘要
arXiv:2503.04832v5 通知类型: 替换-交叉
摘要:可学习的图像压缩(LIC)已显示出在RD效率上可能超越标准化视频编解码器的潜力,从而推动了硬件友好型实现的研究。现有的大多数LIC硬件实现优先考虑延迟而不是RD效率,并通过对硬件设计空间的广泛探索来实现这一点。我们提出了一种新的设计范式,其中将为特定硬件平台调整设计的负担转移到模型维度化上,而不牺牲RD效率。首先,我们设计了一种框架,通过调整单一模型的超参数,可以从参考教师模型中提取一个更精简的学生LIC模型,而无需复杂的硬件设计探索。第二,我们提出了一种硬件友好的通用分割归一化-GDN激活实现方案,即使在参数量化后也能保持RD效率。第三,我们设计了一种流水线化的FPGA配置,通过利用并行处理并优化资源分配,充分利用了可用的FPGA资源。我们的实验显示,与最先进的LIC模型相比,我们在FPGA实现上取得了更好的性能,同时与原始模型的性能非常接近。