LLM2D

摘要

arXiv:2501.14288v2 通知类型: 替换-交叉摘要：大规模语言模型（LLMs）的快速发展使得检测AI生成的文本成为一个越来越关键的挑战。传统方法往往无法捕捉人类和机器生成内容之间的细腻语义差异。因此，我们提出了一种基于语义相似性分析的新型方法，利用一种多层架构，结合预训练的DeBERTa-v3-large模型、双向LSTMs和线性注意力池化，以捕捉局部和全局语义模式。为了提高性能，我们采用了高级输入和输出增强技术，如区域级上下文集成和宽输出配置。这些技术使模型能够学习更多区分性的特征，并在多种领域中泛化。实验结果表明，这种方法比传统方法更有效，证明了其在AI生成的文本检测和其他文本比较任务中的有用性。