LLM2D
西班牙低资源语言的多语言迁移与领域自适应
Multilingual Transfer and Domain Adaptation for Low-Resource Languages of Spain
发布日期: 9/25/2024
arXiv ID: oai:arXiv.org:2409.15924v1

摘要

华为翻译服务中心(HW-TSC)在 (WMT 2024) 中提交了西班牙语低资源语言翻译任务的参赛结果。我们参加了三个翻译任务:西班牙语到阿拉贡语 (es-arg)、西班牙语到阿兰语 (es-arn) 和西班牙语到阿斯图里亚斯语 (es-ast)。针对这三个翻译任务,我们基于训练深度 Transformer-Big 架构的神经机器翻译 (NMT) 模型,采用了多语言迁移、正则化 dropout、正向翻译和反向翻译、LabSE 去噪、转导集成学习等训练策略。通过使用这些增强策略,我们的提交在最终评估中取得了具有竞争力的结果。