LLM2D

摘要

本文介绍了华为翻译服务中心（HW-TSC）提交给WMT24通用机器翻译（MT）共享任务的情况，我们参与了英汉（en2zh）语言对。与往年工作类似，我们采用了正则化丢弃、双向训练、数据多样化、前向翻译、后向翻译、交替训练、课程学习以及转导集成学习等训练策略，基于深度Transformer-big架构训练神经机器翻译（NMT）模型。不同的是，我们还使用了继续预训练、监督微调以及对比偏好优化来训练基于大语言模型（LLM）的MT模型。通过使用最小贝叶斯风险（MBR）解码从多个假设中选择最终翻译，我们的提交在最终评估中取得了有竞争力的结果。