基于同义词替换的可逆自然语言水印方法研究

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:kc1223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可逆自然语言水印技术是自然语言水印技术的一个重要分支,旨在以一种可逆的方式在自然语言文字载体中嵌入水印信息,同时在水印信息提取后,可以完整地恢复原始载体的内容,从而达到保护载体版权和无损恢复载体内容的目的。本文针对现有可逆自然语言水印方法存在的问题,以无损压缩和预测误差扩展技术为重点,研究了基于同义词替换的可逆自然语言水印方法,主要研究内容和研究成果如下:1.为了实现大容量水印嵌入和降低共享的附加信息量,提出了一种基于算术编码和同义替换结合的可逆自然语言水印方法。首先,通过分析同义词的相对频率,将载体文本中用于嵌入信息的同义词量化成一个非均匀分布的冗余二进制序列。然后,利用自适应二进制算术编码将量化后的二进制序列无损地压缩以提供可容纳附加数据的空闲空间。最后,附加了水印信息的压缩数据将通过同义词的替换以可逆方式嵌入到载体文本中生成水印文本。在接收方,通过解码水印文本中出现的同义词提取到水印信息和压缩数据,同时,对提取的压缩数据进行解压缩以获取原始同义词序列的量化值,通过同义词的逆替换无损地恢复出原始载体文本的内容。实验结果表明,该方法无需通过其他途径共享任何辅助数据就可成功地盲提取水印信息并实现原始载体文本的无损恢复,同时达到较高的水印嵌入容量。2.为了进一步提高水印容量和隐蔽性,提出了一种基于上下文合适度预测误差扩展的可逆自然语言水印方法。首先,该方法通过单词的词向量来计算词与词之间的相似度,并根据词的相似度构建大规模同义词词库。其次,利用同义词与上下文单词的词向量距离来衡量同义词在当前上下文中的合适度。通过设置阈值,根据上下文合适度筛选可替换的同义的词集合并进行编码。最后,通过扩展上下文合适度的预测误差来控制同义词的替换,实现水印的嵌入并在水印提取时能恢复出原始的同义词。实验结果表明,该方法能有效地提取水印和可逆地恢复出原始文本,并大幅度地提高水印容量。即使在阈值较高的情况下,该方法仍具有较高的水印容量和高抗检测性。
其他文献
溶瘤病毒疗法是一种利用病毒对肿瘤进行杀伤的治疗方法,溶瘤病毒具有选择性地在肿瘤细胞中复制并杀死肿瘤细胞,而对正常细胞没有杀伤作用,对机体正常组织副作用可以降到最低
我国经济高速增长的同时,长期存在产能过剩和环境污染的问题。特别是近十几年,这两方面的问题十分突出。国家相继出台了一系列环境保护及化解产能过剩的指导意见和政策措施,但尚未根本扭转上述问题。我国经济发展的进程中先后出现的三次较为严重的产能过剩,程度一次比一次严重,可谓存在“屡犯屡治、屡治屡犯”的痼疾,呈现出中国经济传统增长方式下典型的“旧常态”特征。与此同时,在传统的“高投入、高消耗、高污染、低质量、
近几年基于半监督图像分类取得很大的提升并为人工标注标签节省大量劳动力,尤其把生成对抗网络应用与半监督分类中取得不错的效果。Salimans提出的半监督生成对抗网络(Improved GAN)把判别器和分类器结合成一个网络,把有标签的数据输入至判别器并采用交叉熵损失函数提高判别器的分类性能,但对于无标签的数据,判别器仅辨别其真假,并不能对无标签数据进行具体的分类,并且对于生成数据生成较好质量的图像判
苏云金芽胞杆菌(Bacillus thuringiensis,Bt)是一种昆虫病原菌,昆虫中肠内腔的高p H环境正是Bt发挥其杀虫活性的必要条件,目前的研究多关注于其产生的杀虫晶体蛋白的分子作用
属性约简是粗糙集理论研究的重要内容。传统的基于差别矩阵的属性约简方法只能处理一致决策表,改进的差别矩阵则可以对决策表中一致和不一致的对象分别做不同的处理,但改进的
时间序列预测能够为人们提供很好的决策支持,因此时间序列的预测在众多领域中得到了广泛应用。近几十年来,有大量的科研人员在研究时间序列分析模型,也在不断的向分析模型中注入新的方法与思想。随着机器学习技术的兴起,利用机器学习进行时间序列的预测也得到了快速的发展。但时间序列的预测对于满足实际应用还远远不足,还有许多问题有待解决。本文征对时间序列的特点,将时间序列数据转换为监督学习需要的数据类型;再利用多种
古希腊文明是西方文明的基石。吸收和借鉴古希腊文明对于中华文化的发展具有重要意义。本翻译材料取自伦敦国王学院古典学教授托马斯的《希腊人和蛮族》一书中的第一章至第二章。本书是介绍古希腊文明的著作,书中涵盖了对希腊人和蛮族的生活习俗和精神文明等方面的叙述。译者以李长栓的理解、表达、取舍框架为指导,结合具体的翻译技巧进行翻译。原文本主要描述了希腊人和蛮族的性格特征以及生活习俗,重现了希波战争中著名的温泉关
随着集成电路(integrated circuit,IC)设计水平和制造工艺的快速提高,芯片的规模和设计复杂度急剧增加,芯片的时钟频率不断提高,这些都给芯片的测试工作提出了挑战。芯片的可测试性设计(DFT,Design for Testability)已经成为芯片的设计和制造过程中十分必要的环节。DFT技术的意义在于可以减少产品投入到市场的时间(TTM,time to market)、降低测试的费
VR(虚拟现实技术:Virtual Reality,缩写为VR,下文简称VR)全景漫游技术是互联网最新技术之一,通过虚拟现实、三维建模技术构建虚拟展现场景,结合智能终端设备,可以不受时间、空间的限制,以720°全景方式展示物品细节。VR全景漫游展示方式,区别于传统图片、视频等多媒体展示技术,注重与用户的交互,极大限度的提升了用户体验。本文阐述了利用VR技术开发出具有良好交互性的明式家具全景漫游展示
多智能体系统的协同控制技术在民用及军用领域均有广泛应用,如森林防火、边境巡逻等。而协同控制中的一致性算法可以用来实现编队控制、协同侦察、协同搜索等任务,因此世界各