LLM2D

摘要

arXiv:2503.22051v1 宣告类型: cross 摘要: 同时或流式机器翻译在读取输入流的同时生成翻译。这些系统面临质量/延迟的权衡，旨在以最小的延迟实现与非流式模型相媲美的高翻译质量。我们提出了一种有效管理这一权衡的方法。通过增强一个预训练的非流式模型，该模型使用seq2seq机制进行训练并代表了质量的上限，我们通过利用源和目标标记之间的对齐将其转换为流式模型。这种对齐被用于学习一个读写决策边界，以便在最少输入的情况下可靠地生成翻译。在训练过程中，模型通过一个读写策略模块学习决策边界，该模块在对齐点（伪标签）上进行监督学习。读写策略模块是一个小型的二元分类单元，在推理过程中可以控制质量/延迟的权衡。实验结果显示，我们的模型优于几个强baseline，并且与非流式基线模型的差距缩小了。