LLM2D

摘要

arXiv:2504.16913v1 Announce Type: cross 摘要：近年来，由于对学术诚信、虚假信息以及道德的人工智能应用的担忧，AI生成文本的检测已成为一个关键的研究领域。本文提出了一种新型框架COT Fine-tuned，用于检测AI生成的文本并识别负责生成该文本的具体语言模型。我们提出了一种双任务方法，其中任务A涉及将文本分类为AI生成或人类撰写，任务B则识别文本背后的特定LLM。我们方法的关键创新之处在于使用了链式思考推理，这使模型能够为自己的预测生成解释，从而增强透明度和可解释性。我们的实验结果显示，COT Fine-tuned 在两个任务中均实现了高精度，尤其是在LLM识别和人类-AI分类方面表现出色。我们还表明，CoT推理过程对模型的有效性和可解释性做出了重大贡献。