LLM2D

摘要

本文提出了一种高效且准确的文本相关说话人验证 (TDSV) 管道，旨在满足高性能生物识别系统需求。该系统结合了一个基于Fast-Conformer的自动语音识别 (ASR) 模块来验证语音内容，过滤掉目标错误 (TW) 和冒充者错误 (IW) 测试。对于说话人验证，我们提出了一种特征融合方法，该方法结合了从 wav2vec-BERT 和 ReDimNet 模型中提取的说话人嵌入，以创建一个统一的说话人表示。该系统在 TDSV 2024 挑战赛测试集上取得了具有竞争力的结果，归一化最小 DCF 值为 0.0452（排名第二），突出了其在平衡准确性和鲁棒性方面的有效性。