LLM2D
用于文本相关说话人验证 (TdSV) 的 SVASR 系统:AAIC 挑战赛 2024
The SVASR System for Text-dependent Speaker Verification (TdSV) AAIC Challenge 2024
作者: Mohammadreza Molavi, Reza Khodadadi
发布日期: 11/26/2024
arXiv ID: oai:arXiv.org:2411.16276v1

摘要

本文提出了一种高效且准确的文本相关说话人验证 (TDSV) 管道,旨在满足高性能生物识别系统需求。该系统结合了一个基于Fast-Conformer的自动语音识别 (ASR) 模块来验证语音内容,过滤掉目标错误 (TW) 和冒充者错误 (IW) 测试。对于说话人验证,我们提出了一种特征融合方法,该方法结合了从 wav2vec-BERT 和 ReDimNet 模型中提取的说话人嵌入,以创建一个统一的说话人表示。该系统在 TDSV 2024 挑战赛测试集上取得了具有竞争力的结果,归一化最小 DCF 值为 0.0452(排名第二),突出了其在平衡准确性和鲁棒性方面的有效性。