LLM2D
探索用于聊天翻译的传统神经机器翻译模型和大型语言模型
Exploring the traditional NMT model and Large Language Model for chat translation
作者: Jinlong Yang, Hengchao Shang, Daimeng Wei, Jiaxin Guo, Zongyao Li, Zhanglin Wu, Zhiqiang Rao, Shaojun Li, Yuhao Xie, Yuanchang Luo, Jiawei Zheng, Bin Wei, Hao Yang
发布日期: 9/26/2024
arXiv ID: oai:arXiv.org:2409.16331v1

摘要

华为翻译服务中心(HW-TSC)在WMT24聊天翻译共享任务中,针对英语↔德语(en-de)双向翻译提交了相关方案。实验涵盖了使用聊天数据微调模型以及探索各种策略,包括最小贝叶斯风险(MBR)解码和自训练。结果表明,在某些方向上取得了显著的性能提升,其中MBR自训练方法获得了最佳结果。该大型语言模型还讨论了聊天翻译领域中所面临的挑战以及未来研究的潜在方向。