摘要
arXiv:2504.12331v1 声明类型:交叉
摘要:情感-因果-类别三级片段提取代表了情感因果分析中的一项新颖且复杂的挑战。该任务涉及在文本中识别情感片段、因果片段及其相关的情感类别,以形成结构化三元组。尽管先前的研究主要集中在短语级别的情感-因果对提取和情感-因果片段检测上,但这些方法常常受到冗余信息检索和准确确定情感类别困难的挑战,尤其是在情感表达含蓄或模棱两可时。为克服这些挑战,这项研究探讨了对情感-因果-类别三级片段提取的细致方法,并引入了一种结合大型语言模型指令调优和数据增强技术的创新框架。所提出的方法采用任务特定的三元组提取指令,并利用低秩适应来微调大型语言模型,从而避免了复杂任务特定架构的需要。此外,还开发了一种基于提示的数据增强策略,以通过引导大型语言模型生成高质量的合成训练数据来解决数据稀缺问题。广泛的实验评估表明,所提出的方法显著优于现有的基线方法,在情感-因果-类别三级片段提取指标上至少实现了12.8%的提升。结果表明该方法的有效性和鲁棒性,为其在情感因果分析研究中的进一步发展提供了前景。源代码可在 https://github.com/zxgnlp/InstruDa-LLM 获取。