LLM2D

摘要

arXiv:2502.15860v2 Announce Type: replace-cross 摘要：网络霸凌（CB）对儿童构成了紧迫的威胁，凸显了迫切需要 robust 的检测系统以确保在线安全。然而，开发此类系统的进展受到大型、特定于专门任务和目标年龄组的标记数据集稀缺性的阻碍。创建这些数据集在很大程度上依赖于人工注释，不仅耗费资源，还因标注人员接触到有害内容而引发伦理和法律方面的重大关切，尤其是在从脆弱群体（如儿童）中获取此类数据时。本文通过利用大型语言模型（LLMs）生成合成数据和标签，来应对这些挑战。我们的实验表明，合成数据使基于 BERT 的 CB 分类器能够达到与在全真数据集上训练的分类器相近的性能（准确率为 75.8% 对 81.5%）。此外，LLMs 还能有效地为真实但未标记的数据进行标注，从而使基于 BERT 的分类器达到相当的性能水平（准确率为 79.1% 对 81.5%）。这些结果突显了 LLMs 作为生成 CB 检测所需数据的可扩展、伦理和经济有效的解决方案的潜力。