论文部分内容阅读
版权认证是一种对载体进行认证版权归属的行为,要求载体经过一定程度的正常修改能识别出其作者,而经过恶意篡改后的载体能检测出不同于原载体的版权归属。目前最常使用的版权认证方法是数字水印技术。数字水印是将一些代表着版权所有者信息的标记嵌入到数字载体中,并由此可判定该数字载体的版权归属。本文分析了文本水印的研究现状,针对传统水印方法存在容易改变文本语义的问题,零水印不改变载体信息的特点可以弥补这个缺陷。目前文本零水印方法主要集中在提取字符、汉字、词语或者语句的各种统计特征,却忽略了文本语义的特征。文本载体信息中最重要的是文本语义,从文本语义上提取的特征能最大程度地抵抗保持文本语义的修改、编辑,适用于版权认证。本文利用现有的自然语言处理技术,从文本语义的角度提取特征构造文本零水印。第三章提出了一种基于依存句法的零水印算法,结合相关语言知识利用依存句法分析器从语法的角度提取表征文本的特征词以接近文本的语义特征。第四章提出了一种新的基于《知网》的词语相关度计算方法,并且利用该方法提出了一种基于词汇链的零水印算法。利用《知网》的词语相关度计算以构造文本的词汇链,从词汇链中提取出表征文本的特征词。本文提取的特征词使用同义词词林编码以增强水印方案的鲁棒性,然后传入第三方进行注册。在进行注册时需要先比较水印相似度,如果有相似文本则不允许注册。注册水印经过Lo gistic混沌映射加密以增强水印方案的安全性,最后加上时间戳和作者信息。实验结果表明本文的算法对常规编辑操作具有鲁棒性,对恶意攻击具有脆弱性,可以满足文本版权认证的需求。