LLM2D

摘要

我们研究了零样本跨语言新闻情感检测，旨在开发可以在多种语言中部署的鲁棒情感分类器，而无需目标语言训练数据。我们引入了几种资源较少的语言的新型评估数据集，并尝试了各种方法，包括机器翻译的使用；大型语言模型的上下文学习；以及各种中间训练机制，包括一种利用段落级信息的新型任务目标 POA。我们的结果表明，与现有技术相比，性能有了显著提升，其中上下文学习通常表现最佳，但新颖的 POA 方法在计算开销低得多的情况下提供了一种具有竞争力的替代方案。我们还表明，语言相似性本身不足以预测跨语言迁移的成功，但语义内容和结构的相似性也同样重要。