LLM2D

摘要

arXiv:2503.04832v5 通知类型: 替换-交叉摘要：可学习的图像压缩(LIC)已显示出在RD效率上可能超越标准化视频编解码器的潜力，从而推动了硬件友好型实现的研究。现有的大多数LIC硬件实现优先考虑延迟而不是RD效率，并通过对硬件设计空间的广泛探索来实现这一点。我们提出了一种新的设计范式，其中将为特定硬件平台调整设计的负担转移到模型维度化上，而不牺牲RD效率。首先，我们设计了一种框架，通过调整单一模型的超参数，可以从参考教师模型中提取一个更精简的学生LIC模型，而无需复杂的硬件设计探索。第二，我们提出了一种硬件友好的通用分割归一化-GDN激活实现方案，即使在参数量化后也能保持RD效率。第三，我们设计了一种流水线化的FPGA配置，通过利用并行处理并优化资源分配，充分利用了可用的FPGA资源。我们的实验显示，与最先进的LIC模型相比，我们在FPGA实现上取得了更好的性能，同时与原始模型的性能非常接近。