摘要
本文提出了一种高效且准确的文本相关说话人验证 (TDSV) 管道,旨在满足高性能生物识别系统需求。该系统结合了一个基于Fast-Conformer的自动语音识别 (ASR) 模块来验证语音内容,过滤掉目标错误 (TW) 和冒充者错误 (IW) 测试。对于说话人验证,我们提出了一种特征融合方法,该方法结合了从 wav2vec-BERT 和 ReDimNet 模型中提取的说话人嵌入,以创建一个统一的说话人表示。该系统在 TDSV 2024 挑战赛测试集上取得了具有竞争力的结果,归一化最小 DCF 值为 0.0452(排名第二),突出了其在平衡准确性和鲁棒性方面的有效性。