LLM2D
使用模糊理论评估语言模型在 grooming 风险估计中的性能
Evaluating Language Models on Grooming Risk Estimation Using Fuzzy Theory
作者: Geetanjali Bihani, Tatiana Ringenberg, Julia Rayz
发布日期: 2/19/2025
arXiv ID: oai:arXiv.org:2502.12563v1

摘要

arXiv:2502.12563v1 宣告类型: cross 摘要: 对隐含语言的编码对语言模型构成了挑战,尤其是在需要保持高精度的高风险领域。在线儿童诱拐的自动检测就是一个这样的关键领域,其中犯罪分子利用显性和隐含语言的结合来传达有害意图,操纵受害者的心理。虽然最近的研究表明,像SBERT这样的Transformer语言模型在预防诱拐检测方面具有潜力,但它们主要依赖于表面特征,并通过义警和执法部门的对话模拟实际受害者的诱拐过程。迄今为止,这些问题特征和模拟是否合理尚未得到解答。本文旨在弥补这一空白,研究SBERT是否能有效地识别对话中所固有的不同层次的诱拐风险,并在不同参与群体中评估其效果。我们的分析揭示,尽管微调有助于语言模型学习分配诱拐分数,但在涉及更高层次诱拐风险的上下文中,预测结果显示出较高的波动性。这些错误出现在1)利用间接言语途径操纵受害者,以及2)缺乏色情内容的情况下。这一发现强调了对语言模型进行间接言语行为的稳健建模的必要性,特别是在犯罪分子使用的模型中。