论文部分内容阅读
随着互联网技术的快速发展,人们可以利用网络实现数据的实时交互,这些数据中包含了个人隐私等机密信息。为了保证信息的传输安全,信息隐藏技术得到广泛的研究和应用。然而,传统的嵌入式信息隐藏在载体上留下了修改痕迹,难以抵抗隐写分析检测,自身的发展也因此受到局限。基于嵌入式信息隐藏的缺点,学者们提出新的无载体信息隐藏框架:不直接修改载体,以秘密信息序列为驱动生成含密载体。根据载体图像是否源于自然可分为:编码映射式以及构造生成式。其中,采用图像特征的编码式无载体信息隐藏算法扩库难度大,导致算法隐藏容量小,实用化程度较低;并且以自然图像为载体,在大数据背景下可能被溯源,存在一定风险。而完全构造式的无载体算法对算力要求较高,难以直接生成内容合理的载体图像。为了解决上述问题,本文结合半构造式和行为构造式无载体的特点,提出了一种基于图文语义关联的无载体信息隐藏算法:预设模板构造出内容合理的载体图像,通过构造载体中的文字标签实现无载体映射;并以此搭建了一个实用隐蔽通信系统,具体工作内容如下:第一,设计了一套半构造式模板构造规则。通过分析用户在网络平台的社交习惯,设计“看图识义”的益智题模板,基于该模板规则生成构造式载体,实现无载体信息隐藏。不再以编码映射式中的自然图像为载体,整个载体图像是虚拟信息的反映,不存在原始图像对比,并且构造形式具有逻辑合理性,内容易于分享传播,降低第三方怀疑的可能性。第二,基于网络爬虫及卷积神经网络实现了载体的生成。半构造式载体上半部分为图像部分,内容为实时热点,基于网络爬虫技术实现:对指定新闻网站首页URL请求访问,通过Xpath语言解析响应到的HTML文件并匹配新闻标题,利用自然语言处理的分词系统提取标题的关键词,以单个或多个关键词生成模板图像及主题,从而满足预设模板的构造规则。载体下半部分用于无载体信息隐藏,由小尺寸的文字标签拼接而成,利用卷积神经网络实现无载体映射关系的构建。第三,构建了包含干扰样本的完备标签库,提升了无载体隐藏算法的性能。本文通过新的数据集对Alex-Net网络进行迁移学习训练,实现对文字标签进行分类识别;并引入对抗训练的思想,进一步提高识别准确率。这种映射方式也解决了编码映射式无载体隐藏特征难以匹配的难题。经过测试,本文提出的算法保留了无载体抗检测的优点;文字标签具有易识别、尺寸小的特点,减少了图像内容上的冗余。横向对比现有无载体隐藏算法,本文提出的算法进一步提升了隐藏容量,具有更健壮的鲁棒性,综合性能优越,扩宽了无载体信息隐藏的应用背景。最后,以此算法为基础在Matlab2018、Python 3.8的环境下搭建了实用隐蔽通信系统。