LLM2D

摘要

arXiv:2412.11517v2 宣告类型: replace-cross 摘要：随着大型语言模型（LLMs）生成出更加人性化的文本，人们对AI生成文本（AIGT）的副作用的关注不断增加。因此，研究人员已经开发出检测AIGT的方法。然而，仍然存在两个挑战。首先，检测黑盒LLMs的性能较低，因为现有模型主要关注概率特征。其次，大多数AIGT检测器仅在单候选设置下测试过，这种假设认为我们了解AIGT的来源，而这可能与真实世界的情况有所偏差。为了应对这些挑战，我们提出了DART，它包括四个步骤：重述、语义解析、评分和多分类。我们进行了三项实验来测试DART的性能。实验结果显示，DART可以在没有概率特征的情况下区分多个黑盒LLMs，并确定AIGT的来源。