LLM2D

摘要

针对自动语音识别（ASR）系统的持续学习提出了挑战，尤其是在需要避免灾难性遗忘的同时保持先前学习任务性能的情况下。本文介绍了一种利用机器语音链框架实现基于梯度情景记忆（GEM）的ASR持续学习的新方法。通过在机器语音链中加入文本转语音（TTS）组件，我们支持GEM必需的重放机制，使ASR模型能够顺序学习新任务，而不会导致先前任务的性能显著下降。我们在LJ语音数据集上进行的实验表明，我们的方法优于传统的微调和多任务学习方法，在保持各种噪声条件下高性能的同时，实现了显著的错误率降低。我们展示了半监督机器语音链方法在语音识别中实现有效且高效的持续学习的潜力。