摘要
arXiv:2505.03746v1 宣布类型: cross
摘要:社交媒体平台使即时和普遍的连接成为可能,并且在我们的技术社会中对于社会互动和沟通是必不可少的。除了其优势之外,这些平台还引发了在线社区中的负面行为,即所谓的网络欺凌。尽管近年来文献中涉及生成人工智能(AI)的作品很多,但仍有机会在其除零/少量样本学习策略之外的研究其性能。因此,我们提出了一种创新的并实时的网络欺凌检测解决方案,该方案利用基于流的机器学习(ML)模型,能够逐增量处理传入样本,并利用大规模语言模型(LLMs)进行特征工程,以应对在线欺凌和仇恨言论的演变性质。提供了一个可解释性仪表板,以促进系统的可信度、可靠性和问责制。实验数据上的结果报告了接近90%的所有评估指标的良好性能,并且超过了文献中竞争作品所取得的成果。最终,我们的提案通过及时检测欺凌行为来保障在线社区的安全,以防止长期的骚扰并减少社会上的负面后果。