摘要
arXiv:2502.12710v1 宣布类型: cross
摘要:大型语言模型(LLMs)近年来获得了显著的 popularity。识别由人类撰写的文本和由 LLM 生成的文本变得几乎不可能。信息隐藏技术,例如数字水印或隐写术,可以通过在无需注意的情况下嵌入信息来提供帮助。然而,现有的技术,如基于语言或基于格式的方法,会改变语义或不适用于纯文本或未格式化的文本。在本文中,我们介绍了一种名为 TREND 的新信息隐藏方法,它可以将任何字节编码序列隐藏在覆盖文本中。我们提出的方法使用 Kotlin 编程语言实现为一个多平台库,并附带了一个命令行工具和一个网页界面,作为使用示例。通过使用与视觉相似的 Unicode 空格字符替换传统的空格字符,我们提出的方案在不增加字符数的情况下保留了覆盖文本的语义。此外,我们提出了一个秘密消息的特定结构,这使得压缩、加密、散列和错误校正可以进行配置。我们在一个包含一百万篇维基百科文章的数据集上比较了来自文献和实践的十种算法的实验基准,证明了我们提出的方法在各种应用中的稳健性,同时对人类来说是不可见的。我们讨论了嵌入容量有限和进一步稳健性的限制,这指导了未来工作的意义。