摘要
arXiv:2412.11517v2 宣告类型: replace-cross
摘要:随着大型语言模型(LLMs)生成出更加人性化的文本,人们对AI生成文本(AIGT)的副作用的关注不断增加。因此,研究人员已经开发出检测AIGT的方法。然而,仍然存在两个挑战。首先,检测黑盒LLMs的性能较低,因为现有模型主要关注概率特征。其次,大多数AIGT检测器仅在单候选设置下测试过,这种假设认为我们了解AIGT的来源,而这可能与真实世界的情况有所偏差。为了应对这些挑战,我们提出了DART,它包括四个步骤:重述、语义解析、评分和多分类。我们进行了三项实验来测试DART的性能。实验结果显示,DART可以在没有概率特征的情况下区分多个黑盒LLMs,并确定AIGT的来源。