LLM2D
技术术语翻译:机器翻译缩略词的翻译工作流程
On Translating Technical Terminology: A Translation Workflow for Machine-Translated Acronyms
作者: Richard Yue, John E. Ortega, Kenneth Ward Church
发布日期: 9/27/2024
arXiv ID: oai:arXiv.org:2409.17943v1

摘要

专业译员将文档从源语言(SL)翻译成目标语言(TL)的典型工作流程并不总是专注于自然语言处理(NLP)中许多语言模型所做的工作——预测一系列词语中的下一个词。虽然据报道,英语和法语等资源丰富的语言在使用 BLEU 和 COMET 等常见的度量指标进行测量时,已接近人类水平,但我们发现一个重要的步骤被忽略了:专业术语的翻译,特别是缩略词。一些最先进的机器翻译系统,如公开可用的谷歌翻译,在处理缩略词时可能会出错——根据我们的发现,错误率高达 50%。本文通过为 SL-TL(FR-EN)翻译工作流程提出一个额外的步骤来解决 MT 系统的缩略词消歧问题,我们首先提供一个新的缩略词语料库供公众使用,然后实验一个基于搜索的阈值算法,该算法与谷歌翻译和 OpusMT 相比,实现了近 10% 的提升。