摘要
我们研究了零样本跨语言新闻情感检测,旨在开发可以在多种语言中部署的鲁棒情感分类器,而无需目标语言训练数据。我们引入了几种资源较少的语言的新型评估数据集,并尝试了各种方法,包括机器翻译的使用;大型语言模型的上下文学习;以及各种中间训练机制,包括一种利用段落级信息的新型任务目标 POA。我们的结果表明,与现有技术相比,性能有了显著提升,其中上下文学习通常表现最佳,但新颖的 POA 方法在计算开销低得多的情况下提供了一种具有竞争力的替代方案。我们还表明,语言相似性本身不足以预测跨语言迁移的成功,但语义内容和结构的相似性也同样重要。