LLM2D
零样本跨语言新闻情感分析训练策略的评估与解释
Evaluating and explaining training strategies for zero-shot cross-lingual news sentiment analysis
作者: Luka Andren\v{s}ek, Boshko Koloski, Andra\v{z} Pelicon, Nada Lavra\v{c}, Senja Pollak, Matthew Purver
发布日期: 10/1/2024
arXiv ID: oai:arXiv.org:2409.20054v1

摘要

我们研究了零样本跨语言新闻情感检测,旨在开发可以在多种语言中部署的鲁棒情感分类器,而无需目标语言训练数据。我们引入了几种资源较少的语言的新型评估数据集,并尝试了各种方法,包括机器翻译的使用;大型语言模型的上下文学习;以及各种中间训练机制,包括一种利用段落级信息的新型任务目标 POA。我们的结果表明,与现有技术相比,性能有了显著提升,其中上下文学习通常表现最佳,但新颖的 POA 方法在计算开销低得多的情况下提供了一种具有竞争力的替代方案。我们还表明,语言相似性本身不足以预测跨语言迁移的成功,但语义内容和结构的相似性也同样重要。