LLM2D
Home
Arxiv
返回列表
基于一维卷积神经网络的小数据集和约束资源下的说话人识别研究
Towards Speaker Identification with Minimal Dataset and Constrained Resources using 1D-Convolution Neural Network
作者:
Irfan Nafiz Shahan, Pulok Ahmed Auvi
发布日期:
11/25/2024
arXiv ID:
oai:arXiv.org:2411.15082v1
摘要
语音识别和说话人识别对于安全和个人助理等应用至关重要。本文提出了一种轻量级的1D卷积神经网络(1D-CNN),旨在对最小数据集进行说话人识别。我们的方法利用数据增强技术处理背景噪声和有限的训练样本,实现了97.87%的验证准确率。未来的改进包括在更大的数据集上进行测试以及集成迁移学习方法以增强泛化能力。我们提供了所有代码、自定义数据集和训练模型以方便复现。这些资源可在我们的GitHub仓库上找到:https://github.com/IrfanNafiz/RecMe。
查看原文
下载 PDF