摘要
arXiv:2502.12701v1 类型: cross
摘要:较大的模型通常比较小的模型表现更好,但计算成本也更高。级联提供了一种潜在的解决方案。默认情况下,它使用较小的模型,并只将某些实例委托给更大、更强大的模型。然而,设计有效的退让规则仍然是一个挑战。在这篇论文中,我们提出了一种简单而有效的方法,用于机器翻译,使用现有的质量估计(QE)指标作为退让规则。我们表明,基于QE的退让可以让级联系统在调用它仅为一小部分例子(30%到50%)的情况下达到与较大模型相当的性能,从而显著降低计算成本。我们通过自动评估和人工评估来验证这种方法。