摘要
arXiv:2504.16213v1 声学识别类型: 交叉
摘要: 我们培训并部署了一个量化的一维卷积神经网络模型,用于在高度资源受限的物联网边缘设备上进行语音识别。这在各种物联网(IoT)应用中都可能非常有用,例如智能家居、残疾人和老年人的智能环境辅助,仅举几例。在本文中,我们首先创建了一个包含超过一小时音频数据的新数据集,该数据集使我们的研究得以进行,并且未来在该领域的研究也会受益于此。其次,我们利用Edge Impulse提供的技术来提升我们模型的性能,并在数据集上实现了高达97%的高准确度。对于验证,我们使用Arduino Nano 33 BLE Sense微控制器板实现了我们的原型。这款微控制器板专门设计用于物联网和人工智能应用,使它成为我们的目标使用场景的理想选择。而目前大多数现有研究主要集中在有限的一些关键词上,我们的模型可以处理23个不同的关键词,从而实现复杂的命令处理。