摘要
arXiv:2504.13545v1 交叉公告类型
摘要:情感分析对于银行业的品牌声誉管理至关重要,客户的反馈涉及英语、僧伽罗语、Singlish以及混码文本。现有的模型难以处理僧伽罗语等低资源语言,并且缺乏实际应用中的可解释性。本研究开发了一种混合方面情感分析框架,增强了多语言能力并提供了可解释的输出。我们使用清理过的银行客户评论对XLM-RoBERTa进行微调,以适应僧伽罗语和混码文本,集成领域特定词典修正,并使用未加噪的BERT-base进行英语文本的处理。该系统通过置信度分数对情感进行分类(正面、中性、负面),而SHAP和LIME则通过提供实时情感解释来提高可解释性。实验结果显示,我们的方法在英语上优于传统的基于转换器的情感分类器,准确率为92.3%,F1分数为0.89;在僧伽罗语和混码文本上准确率为88.4%。解释性分析揭示了关键的情感驱动因素,提高了信任度和透明度。用户友好的界面提供了方面级情感洞察,确保了业务的可访问性。本研究通过填补多语言、低资源自然语言处理(NLP)和可解释性之间的空白,为金融服务应用贡献了稳健准确的情感分析。