LLM2D
HC3 Plus:一个语义不变的人机ChatGPT对比语料库
HC3 Plus: A Semantic-Invariant Human ChatGPT Comparison Corpus
作者: Zhenpeng Su, Xing Wu, Wei Zhou, Guangyuan Ma, Songlin Hu
发布日期: 10/10/2024
arXiv ID: oai:arXiv.org:2309.02731v4

摘要

ChatGPT凭借其令人印象深刻的性能赢得了广泛关注;然而,人们越来越担心其潜在风险,尤其是在检测AI生成内容 (AIGC) 方面,对于未经训练的个人来说,这通常是一项具有挑战性的任务。目前用于检测ChatGPT生成文本的数据集主要关注问答任务,常常忽略具有语义不变性的任务,例如摘要、翻译和释义。本文证明,在语义不变的任务中检测模型生成的文本更具挑战性。为了解决这一差距,我们引入了一个更广泛、更全面的数据集,该数据集包含比以往工作更广泛的任务,包括那些具有语义不变性的任务。此外,指令微调已在各种任务中展现出优越的性能。在本文中,我们探讨了使用指令微调模型来检测ChatGPT生成的文本。