基于词性统计的中文文本零水印研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户：xjtcfx

【摘要】

：

随着计算机应用的普及与计算机网络的发展，即使在图像、视频和音频数据快速增长的同时，文本数据仍然是互联网上使用最多和最广的一种信息载体，这样就给电子文本的版权保护带来了

【作者】

：

舒娟娟

【机构】

：

湖南大学

【出处】

：

湖南大学

【发表日期】

：

2012年期

【关键词】

：

文本零水印词性信息熵相似度鲁棒性

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机应用的普及与计算机网络的发展，即使在图像、视频和音频数据快速增长的同时，文本数据仍然是互联网上使用最多和最广的一种信息载体，这样就给电子文本的版权保护带来了巨大的挑战。如何保护作者、作品所有者的合法权益成了社会关注的热点，而作为版权保护重要手段之一的文本水印也备受关注。目前，文本水印的研究成果大都集中在嵌入式水印，通过改变载体信息来达到嵌入水印的目的，这样势必会对载体造成一定的影响，甚至会引起攻击者的注意，从而破坏水印。而文本零水印不需要对原始载体做任何修改，它是通过提取文本中的一些特征信息来完成水印的生成，很好地解决了数字水印的不可见性和鲁棒性之间的矛盾。本文针对中文文本零水印进行研究，深入分析已有的文本水印算法，结合自然语言处理技术，主要工作如下：介绍了数字文本水印的概念、特点、分类，并对已有的文本水印算法进行了详细的阐述和深入的研究，分析各自优缺点，总结了目前文本水印研究存在的一些问题。针对文本水印存在的嵌入复杂、水印容量不够及鲁棒性不强等问题提出了两种不同的文本零水印算法。一种是基于词性频率的零水印算法，该算法结合自然语言处理技术，从汉语词性出发，通过统计不同词性的频次确定中频词性，将该词性的词语作为文本特征来构造水印；另一种是基于词性信息熵的文本零水印算法，该算法利用前种算法中已有的词性频次来计算不同词性出现的概率，用该概率获得不同词语的信息熵，进而确定文本中每个句子的信息熵，选出句子信息熵大于阈值的句子，并进行核心词的提取作为文本特征信息。实验结果表明，这两种算法不仅能够抵抗删除空格、字体变换等格式攻击，也能抵抗增加、删除以及同义词变换、句法变换等内容攻击。

其他文献

区域经济发展中人才培养的策略探究

区域经济要发展,人才是关键,也是重要的推动力.本文首先分析了区域经济与人才的内涵,接着从注重人才知识能力与素质协调发展原则等方面提出了区域经济发展中人才培养的策略.

期刊

区域经济人才培养策略

基于DM6437的车道线检测方法的研究

随着社会经济的不断发展和汽车保有量的增加,驾驶的安全性和操作的简单性越来越受到广泛的关注,世界各国都在积极研究开发车辆安全辅助驾驶系统。车道偏离预警系统是智能车辆

学位

车道线消失点霍夫变换Gabor变换

基于FPGA的OFDM通信发送系统的研究与实现

正交频分复用(Orthogonal Frequency Division Multiplexing, OFDM)技术拥有良好的抗多径性能和较高的频谱利用效率,适用于高速无线通信系统。2010年11月国际电信联盟无线通

学位

正交频分复用FPGAIFFT调制循环前缀加窗

基于视频拼接的中国手语合成关键技术研究

手语通过手形和位置的组合变化来传递信息与表达语义,是听障人群的主要沟通工具。手语合成就是把自然语言翻译成手语的技术,为听障人与正常人之间的沟通搭起了桥梁。基于视频

学位

手语合成过渡帧网格形变近似刚性局部控制图像插补源相似时间相关性

弹性光网络中组播相关的虚拟网络功能部署问题的研究

众所周知,通过在跨数据中心的网络中运用网络功能虚拟化技术(NFV),服务提供商能够以更灵活有效的方式充分利用网络资源,并能缩短新服务的部署周期。本论文将研究如何在跨数据

学位

弹性光网络跨数据中心网络网络功能虚拟化组播

基于非圆信号的高分辨率波达方向估计算法研究

近年来,利用信号的统计特性提升波达方向(DOA)估计算法的性能已经成为阵列信号处理的一个重要研究领域。其中,非圆信号因在阵列孔径拓展和估计精度提升等方面的优异性能,更是

学位

阵列信号处理非圆信号波达方向估计中心对称阵列多径传播

基于能量采集的IEEE802.15.6协议性能分析与协议设计

无线体域网是以人体为中心,由若干低功耗、微型、智能的节点和一个协调器组成的人体范围内的无线通信系统,它在多个领域都有重要应用,比如,医疗监控、运动检测等。无线体域网

学位

无线体域网能量采集技术 MAC协议分析马尔科夫模型服务质量MAC协议设计

基于词性统计的中文文本零水印研究

其他学术论文