LLM2D

摘要

本研究评估了机器学习 (ML) 和深度学习 (DL) 模型在检测在线社交网络 (OSNs) 上与 COVID-19 相关的错误信息方面的有效性，旨在开发更有效的工具来应对大流行期间健康错误信息的传播。该研究使用 "COVID19-FNIR DATASET" 训练和测试了各种 ML 分类器（朴素贝叶斯、SVM、随机森林等）、DL 模型（CNN、LSTM、混合 CNN+LSTM）以及预训练语言模型（DistilBERT、RoBERTa）。这些模型在准确率、F1 分数、召回率、精确率和 ROC 方面进行了评估，并使用了词干提取和词形还原等预处理技术。结果表明，SVM 表现良好，F1 分数达到 94.41%。使用 Word2Vec 嵌入的 DL 模型在所有性能指标（准确率、F1 分数、召回率、精确率和 ROC）方面都超过了 98%。CNN+LSTM 混合模型在性能指标方面也超过了 98%，优于 DistilBERT 和 RoBERTa 等预训练模型。我们的研究得出结论，DL 和混合 DL 模型在检测 OSNs 上的 COVID-19 错误信息方面比传统的 ML 算法更有效。研究结果突出了先进的神经网络方法和大型预训练在错误信息检测中的重要性。未来的研究应优化这些模型以适应各种错误信息类型，并适应不断变化的 OSNs，帮助打击健康错误信息。