摘要
arXiv:2403.00144v2 宣告类型: replace-cross
摘要: 当我们用某些翻译方向训练一个多语言模型时,零-shot 翻译能力就会出现;模型随后可以直接在未见过的方向上进行翻译。或者,可以通过经过第三种语言(例如英语)来实现零-shot 翻译。在我们的工作中,我们发现直接翻译和转折翻译都具有噪音,并且其性能不尽如人意。我们提出了一种新颖的双层束搜索算法的集成方法 EBBS,每个集成组件在其较低层次逐步探索其自己的预测步骤,但在较高层次上通过“软投票”机制进行同步。在两个流行的多语言翻译数据集上的结果表明,EBBS 一致优于直接翻译、转折翻译以及现有的集成技术。此外,我们可以通过将集成的知识回输到多语言模型来提高推理效率;更进一步地,基于 EBBS 的回输并不会牺牲,甚至可以提高翻译质量。