LLM2D
CEFW:大规模语言模型中水印的全面评估框架
CEFW: A Comprehensive Evaluation Framework for Watermark in Large Language Models
作者: Shuhao Zhang, Bo Cheng, Jiale Han, Yuli Chen, Zhixuan Wu, Changbao Li, Pingli Gu
发布日期: 3/28/2025
arXiv ID: oai:arXiv.org:2503.20802v1

摘要

arXiv:2503.20802v1 宣告类型: cross 摘要: 文本水印为识别大型语言模型生成的合成文本提供了一种有效解决方案。然而,现有的技术往往专注于满足特定的标准,而忽略了其他关键方面,缺乏统一的评估。为了填补这一空白,我们提出了全面评价框架(CEFW),这是一种统一框架,综合评估了文本水印方法在五个关键维度上的表现:检测的简便性、文本质量的保真度、嵌入成本的最小化、对抗攻击的鲁棒性以及不可感知性以防止仿冒或伪造。通过根据所有这些关键标准评估水印,CEFW 提供了对他们实用性和效果的全面评估。此外,我们引入了一种简单而有效的水印方法,称为平衡水印(BW),它通过平衡水印信息的添加方式来保证鲁棒性和不可感知性。广泛的实验表明,BW 在所有评估维度上都优于现有方法的整体性能。我们向社区发布了我们的代码,供未来的研究使用。https://github.com/DrankXs/BalancedWatermark.