论文部分内容阅读
近年来,跟随着互联网的出现和不断发展,人们进行信息交流的方式发生了巨大的改变。传统的以纸张、磁带、录像带等实物载体的信息交流方式已逐渐被以文档、音频文件、视频文件等二进制文件载体的信息交流方式所替代。如今,由作家所创作的文学作品、由老师或某个领域的专家撰写制作的教学资源、由音乐制作人和影视制作人出版发行的音乐制品和各种影视作品都被拿到互联网上进行交流。这种局面带来了两方面的效应:一方面互联网的出现使得信息更加有效地被传递和分发,使得人们可以快速的获得有用的信息;但另一方面这种信息交流方式也会导致一些没有被授权的用户同样获得了授权用户才能具有的利益。最终使信息资源创造者的利益受到损害,从而大大打击了信息资源创造者的创作热情。于是,人们迫切需要一种技术,要求它既可以继续发挥互联网积极的一面,同时又可以对各种受版权保护的信息资源给与技术上的保护。数字水印技术就是在这样的背景下产生和发展起来的。目前,数字水印技术已经被广泛的应用到图像、音频、视频、文档、软件、数据库等多种应用领域,并取得了不错的应用成果,而逐渐的被人们重视起来。不过目前基于图像、音频和视频的数字水印研究成果居多,并且其中的很多方法是比较有效的,但是这些方法都不太适用于文本文档的规则结构。迄今为止,基于文本的数字水印研究因其特殊性,相关的研究成果主要集中在基于文本的格式方面。即通过对文档的格式作一些微量调整,将信息以二进制编码的形式隐藏于文本对象的变动中。这类算法由于完全依赖于文本格式(行移、字移、特征编码等),均存在抗攻击性不够强,鲁棒性较差的缺点。究其原因,主要是因为水印信息只能加入文本内容之外,而无法加入文本内容之中。因此,必须研究基于内容的文本数字水印算法才能较好地解决这一问题。本文通过研究图形学中图与图之间的关系以及人类对汉字认知习惯的特点,将汉字拆分为多个汉字部件,再将每个汉字部件看作一个图形单位,对照图与图之间的关系,将这些汉字部件进行不同方式的组合。从而使同一个汉字具备了多个字形。然后,通过使用不同的字形,将水印信息嵌入到文本当中。这种算法成功的将水印信息隐藏于文本的内容之中,从而较之以前的各种水印算法,在水印的不可感知性、鲁邦性等方面均获得了很大的进步。本文在最后,通过理论分析与实验分析,从两方面验证了本文所提出的水印算法即可应用于电子文档,又可应用于纸制文档,同时也验证了该算法具有很强的不可感知性和鲁邦性。