LLM2D

摘要

arXiv:2502.12701v1 类型: cross 摘要：较大的模型通常比较小的模型表现更好，但计算成本也更高。级联提供了一种潜在的解决方案。默认情况下，它使用较小的模型，并只将某些实例委托给更大、更强大的模型。然而，设计有效的退让规则仍然是一个挑战。在这篇论文中，我们提出了一种简单而有效的方法，用于机器翻译，使用现有的质量估计（QE）指标作为退让规则。我们表明，基于QE的退让可以让级联系统在调用它仅为一小部分例子（30%到50%）的情况下达到与较大模型相当的性能，从而显著降低计算成本。我们通过自动评估和人工评估来验证这种方法。