LLM2D

摘要

利用语言似然度大小区分人写文本和模型生成文本的方法越来越难以奏效，因为语言模型生成类人文本的能力不断提升。本研究提出了一种新的视角，使用相对似然度值而非绝对值，并从似然度谱视图中提取特征用于人机文本检测任务。我们提出了一种包含两种分类方法（分别为监督方法和启发式方法）的检测程序，其性能与之前的零样本检测方法相比具有竞争力，并在短文本检测方面取得了新的 state-of-the-art 结果。我们的方法还可以揭示人写语言和模型语言之间的细微差异，这些差异在心理语言学研究中找到了理论依据。我们的代码可在 https://github.com/CLCS-SUSTech/FourierGPT 获取。