LLM2D

摘要

语音识别和说话人识别对于安全和个人助理等应用至关重要。本文提出了一种轻量级的1D卷积神经网络（1D-CNN），旨在对最小数据集进行说话人识别。我们的方法利用数据增强技术处理背景噪声和有限的训练样本，实现了97.87%的验证准确率。未来的改进包括在更大的数据集上进行测试以及集成迁移学习方法以增强泛化能力。我们提供了所有代码、自定义数据集和训练模型以方便复现。这些资源可在我们的GitHub仓库上找到：https://github.com/IrfanNafiz/RecMe。