论文部分内容阅读
随着计算机技术和因特网技术的飞速发展,数字作品的传播达到了前所未有的深度和广度,其版权保护也正成为一个迫切需要解决的问题。数字水印是近十年来出现的一种有效的数字产品版权保护技术。它克服了传统密码学技术中加密的内容在解密之后不再安全的问题,因而作为知识产权保护和数字多媒体防伪的有效手段,正得到广泛的研究与应用。 目前,基于图像、视频和音频的数字水印研究成果很多,并且很多方法是比较有效的。但是这些方法都不太适用于文本文档的规则结构。迄今为止,基于文本的数字水印研究因其特殊性,相关的研究成果主要集中在基于文本的格式方面,即通过对文档的格式作一些微量调整,将信息以二进制编码的形式隐藏于文本对象的变动中。这类算法由于完全依赖于文本格式(行移、字移、特征编码等),均存在抗攻击性不够强,鲁棒性较差的缺点。究其原因,主要是因为水印信息只能加入文本内容之外,而无法加入文本内容之中。因此,必须研究基于内容的文本数字水印算法才能较好地解决这一问题。 本文一方面保留基于格式编码的文本数字水印思想,另一方面着力研究英文文本的单词间字符内容与格式,从而提出了一种同时基于内容及格式的文本数字水印算法——基于单词间字符统计特征的文本数字水印。该方法把英文文本中的特殊字符——单词与单词之间的间隔符抽取出来,考察其内容与格式,以此作为加载水印的依据。但又不以单个间隔符充当承载水印的载体区域,而是按照一定的算法将单词分类,进而在每个句子内以相邻单词构建小组,然后计算整个文本同类型小组内单词问隔符的某些统计特征,并以此为依据嵌入水印。因此,本文研究的算法一方面保持着原有文本数字水印方法基于格式的特点,另一方面又注入了基于内容的新思想,同时水印的嵌入还基于一定的统计分布规律。这些特点使得该算法克服了完全基于格式的文本数字水印方法的不足,抗攻击能力有所提高,鲁棒性有所增强。 为了充分说明本文提出的文本数字水印算法的可行性,本文设计并实现了一个基于单词间字符统计特征的文本数字水印程序,可以完整地展示这一方法加载水印和检测水印的全过程。实验结果表明,该方法不仅能完全抵抗格式攻击,而且还能一定程度地抵抗对文本内容的多种攻击,其鲁棒性较完全基于格式的文本数字水印方法具有较大改进。