LLM2D
使用相对传输函数的端到端多 microphone 讲话人提取
End-to-End Multi-Microphone Speaker Extraction Using Relative Transfer Functions
作者: Aviad Eisenberg, Sharon Gannot, Shlomo E. Chazan
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2502.06285v1

摘要

arXiv:2502.06285v1 声源类型: cross 摘要:本文介绍了一种多麦克风方法,用于从涉及多个说话人和方向性噪声的混响环境中提取所需说话人的信号。在这项工作中,我们提出了利用参考语音在同一位置录制的目标源的瞬时相对传输函数(RTF)。基于RTF的空间线索的效果与基于到达方向(DOA)的空间线索以及传统的频谱嵌入进行了比较。在具有挑战性的声学场景下的实验结果表明,使用空间线索比基于频谱的线索具有更好的性能,并且瞬时RTF比基于DOA的空间线索表现更好。