LLM2D

摘要

ChatGPT凭借其令人印象深刻的性能赢得了广泛关注；然而，人们越来越担心其潜在风险，尤其是在检测AI生成内容 (AIGC) 方面，对于未经训练的个人来说，这通常是一项具有挑战性的任务。目前用于检测ChatGPT生成文本的数据集主要关注问答任务，常常忽略具有语义不变性的任务，例如摘要、翻译和释义。本文证明，在语义不变的任务中检测模型生成的文本更具挑战性。为了解决这一差距，我们引入了一个更广泛、更全面的数据集，该数据集包含比以往工作更广泛的任务，包括那些具有语义不变性的任务。此外，指令微调已在各种任务中展现出优越的性能。在本文中，我们探讨了使用指令微调模型来检测ChatGPT生成的文本。