LLM2D

摘要

arXiv:2504.13545v1 交叉公告类型摘要：情感分析对于银行业的品牌声誉管理至关重要，客户的反馈涉及英语、僧伽罗语、Singlish以及混码文本。现有的模型难以处理僧伽罗语等低资源语言，并且缺乏实际应用中的可解释性。本研究开发了一种混合方面情感分析框架，增强了多语言能力并提供了可解释的输出。我们使用清理过的银行客户评论对XLM-RoBERTa进行微调，以适应僧伽罗语和混码文本，集成领域特定词典修正，并使用未加噪的BERT-base进行英语文本的处理。该系统通过置信度分数对情感进行分类（正面、中性、负面），而SHAP和LIME则通过提供实时情感解释来提高可解释性。实验结果显示，我们的方法在英语上优于传统的基于转换器的情感分类器，准确率为92.3%，F1分数为0.89；在僧伽罗语和混码文本上准确率为88.4%。解释性分析揭示了关键的情感驱动因素，提高了信任度和透明度。用户友好的界面提供了方面级情感洞察，确保了业务的可访问性。本研究通过填补多语言、低资源自然语言处理（NLP）和可解释性之间的空白，为金融服务应用贡献了稳健准确的情感分析。