LLM2D

摘要

arXiv:2410.20021v2 宣告类型: 替换-交叉摘要：跨语言摘要（CLS）旨在为目标语言生成源文本的摘要。目前，指令微调的大型语言模型（LLMs）在各种英语任务中表现出色。然而，与英语、中文或西班牙语不同，对于那些资源相对较少、使用或数据有限的低资源语言，最近的研究显示，在少量提示设置下，LLMs在CLS任务上的表现仍不尽如人意。这引发了问题：LLMs是否能够处理低资源语言的跨语言摘要任务？为了解决这一问题，我们通过四步零样本方法“总结、改进、翻译和润色”（SITR）及其相应设计的提示，全面探索了大型语言模型在低资源语言跨语言摘要任务中的潜力。我们在两种知名的跨语言摘要数据集上使用多种LLMs，对各种低资源目标语言进行了测试。结果显示：i) GPT-3.5 和 GPT-4 在使用我们的零样本 SITR 方法时，显著且一致地超越了其他基线方法。ii) 通过采用我们的方法，我们释放了LLMs的潜力，使它们能够有效地处理低资源语言的跨语言摘要任务。