LLM2D
家之音:用于声音事件检测的语音去除住宅音频数据集
The Sounds of Home: A Speech-Removed Residential Audio Dataset for Sound Event Detection
作者: Gabriel Bibb\'o, Thomas Deacon, Arshdeep Singh, Mark D. Plumbley
发布日期: 10/7/2024
arXiv ID: oai:arXiv.org:2409.11262v2

摘要

本文介绍了一个住宅音频数据集,用于支持智能家居应用中的声音事件检测研究,旨在促进老年人的福祉。该数据集通过在 8 位 55-80 岁的参与者家中部署音频记录系统,持续 7 天来构建。通过详细的平面图和建筑材料信息记录声学特征,以便在 AI 模型部署中复制记录环境。本文开发了一种新颖的自动语音去除管道,利用预先训练的音频神经网络检测和去除包含语音的片段,同时保留包含其他声音事件的片段。由此产生的数据集包含符合隐私的音频记录,准确地捕捉住宅空间内的音景和日常生活活动。本文详细介绍了数据集的创建方法、利用级联模型架构的语音去除管道以及对语音标签分布的分析,以验证语音去除过程。该数据集可以用于开发和基准测试专门针对家庭应用的声音事件检测模型。