LLM2D
基于 pivot 翻译的单模型集成框架 neural machine translation
A Single Model Ensemble Framework for Neural Machine Translation using Pivot Translation
作者: Seokjin Oh, Keonwoong Noh, Woohwan Jung
发布日期: 2/4/2025
arXiv ID: oai:arXiv.org:2502.01182v1

摘要

arXiv:2502.01182v1 Announce Type: cross 摘要:尽管在神经机器翻译方面取得了显著进展,但对于低资源语言对而言,性能仍不尽如人意。多种系统集成是一种广泛采用的方法来提升性能,通常通过组合概率分布来实现。然而,以往的方法面临着训练多个模型时计算成本高的挑战。此外,对于黑盒模型,在每次解码步骤中平均词级概率是不现实的。为了解决多模型集成方法的问题,我们提出了一种基于枢纽的单模型集成策略。该策略由两个步骤组成:基于枢纽的候选生成和事后聚合。在第一步中,我们通过枢纽翻译生成候选。这只需一个模型即可实现,并且可以从高资源枢纽语言中传递知识,从而生成不仅多样而且更准确的候选。接下来,在聚合步骤中,我们从生成的候选中选择k个高质量候选并合并它们,生成一个超越现有候选的最终翻译。我们的实验结果表明,通过利用枢纽翻译中的候选来捕获源句子的微妙之处,我们的方法可以生成高质量的翻译。