摘要
arXiv:2503.18681v2 通知类型: 交叉替换
摘要:作为自然语言处理(NLP)领域中的一项重要研究方向,讽刺检测引起了广泛的关注。传统的讽刺检测任务通常集中于单一模态方法(例如文本),但由于讽刺的隐含性和微妙性,这些方法往往未能取得满意的结果。近年来,研究人员将讽刺检测的重点转向了多模态方法。然而,有效地利用多模态信息以准确识别讽刺内容仍然是一项值得进一步探索的挑战。借助多模态大型语言模型(MLLMs)对各种信息源的强大综合处理能力,我们提出了一种创新的多模态Commander-GPT框架。受军事战略的启发,我们首先将讽刺检测任务分解为六个不同的子任务。然后,一个中央指挥官(决策者)指派最适合的大型语言模型来解决每个具体子任务。最终,将每个模型的检测结果汇总以识别讽刺。我们在MMSD和MMSD 2.0上进行了广泛的实验,使用了四种多模态大型语言模型和六种提示策略。我们的实验表明,我们的方法在F1分数上达到了最先进的性能,提升了19.3%,并且无需微调或真实注释的理由。