摘要
arXiv:2410.20021v2 宣告类型: 替换-交叉
摘要:跨语言摘要(CLS)旨在为目标语言生成源文本的摘要。目前,指令微调的大型语言模型(LLMs)在各种英语任务中表现出色。然而,与英语、中文或西班牙语不同,对于那些资源相对较少、使用或数据有限的低资源语言,最近的研究显示,在少量提示设置下,LLMs在CLS任务上的表现仍不尽如人意。这引发了问题:LLMs是否能够处理低资源语言的跨语言摘要任务?为了解决这一问题,我们通过四步零样本方法“总结、改进、翻译和润色”(SITR)及其相应设计的提示,全面探索了大型语言模型在低资源语言跨语言摘要任务中的潜力。我们在两种知名的跨语言摘要数据集上使用多种LLMs,对各种低资源目标语言进行了测试。结果显示:i) GPT-3.5 和 GPT-4 在使用我们的零样本 SITR 方法时,显著且一致地超越了其他基线方法。ii) 通过采用我们的方法,我们释放了LLMs的潜力,使它们能够有效地处理低资源语言的跨语言摘要任务。