LLM2D
多带Mamba网络的深度主动语音 cancellation
Deep Active Speech Cancellation with Multi-Band Mamba Network
作者: Yehuda Mishaly, Lior Wolf, Eliya Nachmani
发布日期: 2/4/2025
arXiv ID: oai:arXiv.org:2502.01185v1

摘要

arXiv:2502.01185v1 通知类型: 交叉 摘要: 我们提出了一种新颖的深度学习网络,用于主动语音取消(ASC),其超越了传统的主动噪声取消(ANC)方法,有效地消除了噪声和语音信号。所提出的多频带Mamba架构将输入音频分割成不同的频带,从而实现精确的抗信号生成,并在频率上提高相位对齐效果。此外,我们引入了一种基于优化的损失函数,提供了近乎最优的抗信号生成监督信号。实验结果表明,在主动噪声取消(ANC)场景中实现了高达7.2dB的性能提升,在ASC中实现了6.2dB的提升,显著优于现有方法。音频样本可在 https://mishalydev.github.io/DeepASC-Demo 获取。