LLM2D
基于变换器架构和集成技术的人工生成文本和AI生成文本语义相似性分析综合框架
A Comprehensive Framework for Semantic Similarity Analysis of Human and AI-Generated Text Using Transformer Architectures and Ensemble Techniques
作者: Lifu Gao, Ziwei Liu, Qi Zhang
发布日期: 2/3/2025
arXiv ID: oai:arXiv.org:2501.14288v2

摘要

arXiv:2501.14288v2 通知类型: 替换-交叉 摘要:大规模语言模型(LLMs)的快速发展使得检测AI生成的文本成为一个越来越关键的挑战。传统方法往往无法捕捉人类和机器生成内容之间的细腻语义差异。因此,我们提出了一种基于语义相似性分析的新型方法,利用一种多层架构,结合预训练的DeBERTa-v3-large模型、双向LSTMs和线性注意力池化,以捕捉局部和全局语义模式。为了提高性能,我们采用了高级输入和输出增强技术,如区域级上下文集成和宽输出配置。这些技术使模型能够学习更多区分性的特征,并在多种领域中泛化。实验结果表明,这种方法比传统方法更有效,证明了其在AI生成的文本检测和其他文本比较任务中的有用性。