LLM2D

摘要

arXiv:2504.20124v1 交叉公告类型摘要：儿童哮喘的早期检测对于预防长期呼吸并发症并减少急诊干预至关重要。本文介绍了一个基于AI的诊断管道，该管道利用Google的健康声学表示（HeAR）模型从儿科呼吸音中检测哮喘的早期迹象。使用SPRSound数据集，这是第一个开放访问的1个月至18岁儿童标注的呼吸音集合，从中提取2秒的音频片段，这些片段被标记为喘鸣、啰音、哮鸣音、喘息或正常。每个片段通过HeAR（在包括1亿个咳嗽声音的3亿个健康相关的音频片段上预训练的基础模型）嵌入到512维表示中。使用这些嵌入，训练了包括SVM、随机森林和MLP在内的多个分类器，以区分哮喘症状和正常声音。该系统实现了超过91%的准确性，在阳性病例的精确召回度量上表现出色。除了分类外，学习到的嵌入通过PCA进行可视化，通过波形回放分析错分类，提供ROC和混淆矩阵见解。此方法表明，当由基础音频模型支持时，短时、低资源的儿科录音可以实现快速、无创的哮喘筛查。该方法尤其适用于偏远或服务不足的医疗保健环境中的数字诊断。