LLM2D
CleanUMamba:基于通道剪枝的紧凑型Mamba网络用于语音降噪
CleanUMamba: A Compact Mamba Network for Speech Denoising using Channel Pruning
作者: Sjoerd Groot, Qinyu Chen, Jan C. van Gemert, Chang Gao
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2410.11062v2

摘要

arXiv:2410.11062v2 宣告类型: replace-cross 摘要:本文介绍了CleanUMamba,这是一种用于实时因果音频降噪的时间域神经网络架构,直接应用于原始波形。CleanUMamba利用了U-Net编码器-解码器结构,并在瓶颈层中加入了Mamba状态空间模型。通过将传统的自注意力机制和LSTM机制替换为Mamba,我们的架构在保持恒定内存占用的同时提供了卓越的降噪性能,从而支持流式操作。为了提高效率,我们应用了结构化通道剪枝,实现了8倍模型大小的减少,而无需牺牲音频质量。我们的模型在2020年Interspeech深度噪声抑制挑战赛中表现出色。具体而言,CleanUMamba仅使用442K参数和468M MACs,实现了PESQ评分为2.42和STOI为95.1%,并且在实时性能上与更大规模的模型相匹配或超越。代码将在以下地址提供:https://github.com/lab-emi/CleanUMamba