LLM2D
Home
Arxiv
返回列表
探索自监督音频编码器中的蝙蝠鸣叫音节表示
Exploring bat song syllable representations in self-supervised audio encoders
发布日期:
9/20/2024
arXiv ID:
oai:arXiv.org:2409.12634v1
摘要
arXiv:2409.12634v1 公告类型: 交叉 摘要: 在人类生成的声音上训练的深度学习模型在区分其他物种的鸣叫类型方面表现如何?我们分析了几种自监督音频编码器中蝙蝠鸣叫音节的编码情况,发现预训练于人类语音的模型生成了最具区分性的不同音节类型表示。这些发现为跨物种迁移学习在蝙蝠生物声学中的应用奠定了初步基础,同时也加深了对音频编码器模型中分布外信号处理的理解。
查看原文
下载 PDF