摘要
arXiv:2504.16913v1 Announce Type: cross
摘要:近年来,由于对学术诚信、虚假信息以及道德的人工智能应用的担忧,AI生成文本的检测已成为一个关键的研究领域。本文提出了一种新型框架COT Fine-tuned,用于检测AI生成的文本并识别负责生成该文本的具体语言模型。我们提出了一种双任务方法,其中任务A涉及将文本分类为AI生成或人类撰写,任务B则识别文本背后的特定LLM。我们方法的关键创新之处在于使用了链式思考推理,这使模型能够为自己的预测生成解释,从而增强透明度和可解释性。我们的实验结果显示,COT Fine-tuned 在两个任务中均实现了高精度,尤其是在LLM识别和人类-AI分类方面表现出色。我们还表明,CoT推理过程对模型的有效性和可解释性做出了重大贡献。