摘要
arXiv:2502.19115v2 宣告类型: 替换-交叉
摘要:本研究介绍了一种新型自然语言处理流水线,通过自动检测和分类电子邮件主题,提高塞尔维亚领先的电信公司Telekom Srbija的客户服务效率。该流水线的核心是BERTopic,这是一个模块化的框架,允许无监督主题建模。经过一系列预处理和后处理步骤后,我们为每封进来的电子邮件分配一个主题(共12个主题)和多个额外标签,使得客户服务可以通过自定义的应用程序筛选和访问这些邮件。通过评估自动分配的主题的速度和准确性,模型的性能得到了评估,加权平均处理时间为每封电子邮件0.041秒,加权平均F1分为0.96。该流水线在多种语言中显示出广泛的适用性,特别适用于低资源语言和形态丰富的语言。该系统现在已在公司的生产环境中运行,通过自动电子邮件分类来简化客户服务操作。