LLM2D
聪明翻译,不费力:基于质量意识推迟的级联翻译系统
Translate Smart, not Hard: Cascaded Translation Systems with Quality-Aware Deferral
作者: Ant\'onio Farinhas, Nuno M. Guerreiro, Sweta Agrawal, Ricardo Rei, Andr\'e F. T. Martins
发布日期: 2/19/2025
arXiv ID: oai:arXiv.org:2502.12701v1

摘要

arXiv:2502.12701v1 类型: cross 摘要:较大的模型通常比较小的模型表现更好,但计算成本也更高。级联提供了一种潜在的解决方案。默认情况下,它使用较小的模型,并只将某些实例委托给更大、更强大的模型。然而,设计有效的退让规则仍然是一个挑战。在这篇论文中,我们提出了一种简单而有效的方法,用于机器翻译,使用现有的质量估计(QE)指标作为退让规则。我们表明,基于QE的退让可以让级联系统在调用它仅为一小部分例子(30%到50%)的情况下达到与较大模型相当的性能,从而显著降低计算成本。我们通过自动评估和人工评估来验证这种方法。