摘要
arXiv:2501.14288v2 通知类型: 替换-交叉
摘要:大规模语言模型(LLMs)的快速发展使得检测AI生成的文本成为一个越来越关键的挑战。传统方法往往无法捕捉人类和机器生成内容之间的细腻语义差异。因此,我们提出了一种基于语义相似性分析的新型方法,利用一种多层架构,结合预训练的DeBERTa-v3-large模型、双向LSTMs和线性注意力池化,以捕捉局部和全局语义模式。为了提高性能,我们采用了高级输入和输出增强技术,如区域级上下文集成和宽输出配置。这些技术使模型能够学习更多区分性的特征,并在多种领域中泛化。实验结果表明,这种方法比传统方法更有效,证明了其在AI生成的文本检测和其他文本比较任务中的有用性。