LLM2D

摘要

arXiv:2502.12563v1 宣告类型: cross 摘要: 对隐含语言的编码对语言模型构成了挑战，尤其是在需要保持高精度的高风险领域。在线儿童诱拐的自动检测就是一个这样的关键领域，其中犯罪分子利用显性和隐含语言的结合来传达有害意图，操纵受害者的心理。虽然最近的研究表明，像SBERT这样的Transformer语言模型在预防诱拐检测方面具有潜力，但它们主要依赖于表面特征，并通过义警和执法部门的对话模拟实际受害者的诱拐过程。迄今为止，这些问题特征和模拟是否合理尚未得到解答。本文旨在弥补这一空白，研究SBERT是否能有效地识别对话中所固有的不同层次的诱拐风险，并在不同参与群体中评估其效果。我们的分析揭示，尽管微调有助于语言模型学习分配诱拐分数，但在涉及更高层次诱拐风险的上下文中，预测结果显示出较高的波动性。这些错误出现在1）利用间接言语途径操纵受害者，以及2）缺乏色情内容的情况下。这一发现强调了对语言模型进行间接言语行为的稳健建模的必要性，特别是在犯罪分子使用的模型中。