LLM2D

摘要

arXiv:2504.16213v1 声学识别类型: 交叉摘要: 我们培训并部署了一个量化的一维卷积神经网络模型，用于在高度资源受限的物联网边缘设备上进行语音识别。这在各种物联网(IoT)应用中都可能非常有用，例如智能家居、残疾人和老年人的智能环境辅助，仅举几例。在本文中，我们首先创建了一个包含超过一小时音频数据的新数据集，该数据集使我们的研究得以进行，并且未来在该领域的研究也会受益于此。其次，我们利用Edge Impulse提供的技术来提升我们模型的性能，并在数据集上实现了高达97%的高准确度。对于验证，我们使用Arduino Nano 33 BLE Sense微控制器板实现了我们的原型。这款微控制器板专门设计用于物联网和人工智能应用，使它成为我们的目标使用场景的理想选择。而目前大多数现有研究主要集中在有限的一些关键词上，我们的模型可以处理23个不同的关键词，从而实现复杂的命令处理。