LLM2D
增强航空通信转录:使用LoRA fine-tune Distil-Whisper
Enhancing Aviation Communication Transcription: Fine-Tuning Distil-Whisper with LoRA
作者: Shokoufeh Mirzaei, Jesse Arzate, Yukti Vijay
发布日期: 4/1/2025
arXiv ID: oai:arXiv.org:2503.22692v1

摘要

arXiv:2503.22692v1 宣传类型:交叉 摘要:航空通信的转录具有多种应用,从协助空中交通管制员识别回话错误的准确性到搜救行动。最近的人工智能进步为改善航空通信转录任务提供了前所未有的机会。OpenAI的Whisper是领先的自动语音识别模型之一。然而,将Whisper微调以适应航空通信转录并不具有计算效率。因此,本文旨在使用参数高效微调方法Low-Rank Adaptation来微调一个更为计算高效的Whisper版本,即distil-Whisper。为了进行微调,我们使用了Linguistic Data Consortium提供的Air Traffic Control Corpus数据集,该数据集包含约70小时的三个主要美国机场附近的管制员和飞行员的通信传输。目标是降低单词错误率,以提高航空通信转录的准确性。首先,我们从LoRA的初始超参数集(Alpha = 64 和 Rank = 32)开始进行网格搜索。我们应用5折交叉验证来找到distil-Whisper超参数的最佳组合。然后,我们在LoRA超参数上微调了模型,在五折中的平均单词错误率为3.86%。这一结果突显了该模型在驾驶舱中的潜在应用价值。