LLM2D

摘要

arXiv:2502.01182v1 Announce Type: cross 摘要：尽管在神经机器翻译方面取得了显著进展，但对于低资源语言对而言，性能仍不尽如人意。多种系统集成是一种广泛采用的方法来提升性能，通常通过组合概率分布来实现。然而，以往的方法面临着训练多个模型时计算成本高的挑战。此外，对于黑盒模型，在每次解码步骤中平均词级概率是不现实的。为了解决多模型集成方法的问题，我们提出了一种基于枢纽的单模型集成策略。该策略由两个步骤组成：基于枢纽的候选生成和事后聚合。在第一步中，我们通过枢纽翻译生成候选。这只需一个模型即可实现，并且可以从高资源枢纽语言中传递知识，从而生成不仅多样而且更准确的候选。接下来，在聚合步骤中，我们从生成的候选中选择k个高质量候选并合并它们，生成一个超越现有候选的最终翻译。我们的实验结果表明，通过利用枢纽翻译中的候选来捕获源句子的微妙之处，我们的方法可以生成高质量的翻译。