LLM2D
西班牙低资源语言的多语言迁移与领域自适应
Multilingual Transfer and Domain Adaptation for Low-Resource Languages of Spain
作者: Yuanchang Luo, Zhanglin Wu, Daimeng Wei, Hengchao Shang, Zongyao Li, Jiaxin Guo, Zhiqiang Rao, Shaojun Li, Jinlong Yang, Yuhao Xie, Jiawei Zheng Bin Wei, Hao Yang
发布日期: 10/1/2024
arXiv ID: oai:arXiv.org:2409.15924v2

摘要

本文介绍了华为翻译服务中心 (HW-TSC) 在 (WMT 2024) 中提交的西班牙语低资源语言翻译任务的状态。我们参加了三个翻译任务:西班牙语到阿拉贡语 (es-arg)、西班牙语到阿兰语 (es-arn) 和西班牙语到阿斯图里亚斯语 (es-ast)。对于这三个翻译任务,我们使用多语言迁移、正则化 dropout、正向翻译和反向翻译、labse 降噪、转导集成学习等策略来训练基于深度 transformer-big 架构的神经机器翻译 (NMT) 模型。通过使用这些增强策略,我们的提交在最终评估中取得了具有竞争力的结果。