摘要
arXiv:2503.22051v1 宣告类型: cross
摘要: 同时或流式机器翻译在读取输入流的同时生成翻译。这些系统面临质量/延迟的权衡,旨在以最小的延迟实现与非流式模型相媲美的高翻译质量。我们提出了一种有效管理这一权衡的方法。通过增强一个预训练的非流式模型,该模型使用seq2seq机制进行训练并代表了质量的上限,我们通过利用源和目标标记之间的对齐将其转换为流式模型。这种对齐被用于学习一个读写决策边界,以便在最少输入的情况下可靠地生成翻译。在训练过程中,模型通过一个读写策略模块学习决策边界,该模块在对齐点(伪标签)上进行监督学习。读写策略模块是一个小型的二元分类单元,在推理过程中可以控制质量/延迟的权衡。实验结果显示,我们的模型优于几个强baseline,并且与非流式基线模型的差距缩小了。