基于多规则下自然语言文本隐写的研究

来源 :兰州大学 | 被引量 : 0次 | 上传用户:randygu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学及网络技术为主导的信息科学及产业的飞速发展,诸如窃听、重放、抵赖、信息泄露、非法使用等信息安全问题也日益凸显。相较于传统的信息加密技术,信息隐写技术可以以一种更加隐秘的方式保护重要的信息。信息隐写通常采用冗余量较大的载体完成,例如图像,音频,视频等。文本作为历史最悠久、使用量最大的媒体信息,由于冗余量较小而难以搭载太多秘密信息,但也因此更有研究价值。在本文中,我们以自然语言文本作为隐写研究对象,从不同的角度出发,对于自然语言文本隐写方法加以研究,具体研究内容和取得的工作成果如下:
  (1)开展了基于变语法规则的文本信息隐写方法研究。
  在研究中我们发现,不同维度的语法模型在构建过程中对于训练文本所抓取的特征不同,因此影响到最后生成的隐写文本质量。因此,我们将不同维度语法模型加以结合,以利用不同维度语法模型的各自优势。在研究中,我们提出了基于此思想的、两种不同混合语法规则的隐写模型,即基于半频交叉规则的文本信息隐写方法和基于多规则语言模型交替的文本信息隐写方法。这两种方法都是尝试在更为灵活的语言关系基础之上实现隐写文本的生成,以期待取得更好的隐写效果。我们对所提出方法完成了建模并选用了不同类别的数据进行实验,验证了方法的有效性。
  (2)开展了基于转移概率的文本信息隐写方法研究。
  在研究中我们突出了马尔可夫链状态转移图中转移概率的作用,并基于此思想提出了三种不同的隐写方法。首先提出了基于状态转移二进制序列的文本信息隐写方法。在该方法中,我们不仅紧紧围绕马尔可夫链中的转移概率这一概念对隐写模型进行设计,而且我们在信息通讯过程中对部分重要信息进行二次加密,进一步加强了信息的通讯安全。其次,我们提出了在模型中选择最优及次优语言序列的基于单比特规则的文本信息隐写方法,旨在将文本中较优的语言特征保存下来指导隐写文本的生成。最后,我们提出了一种基于变比特规则的文本信息隐写方法,在最大程度上保留了训练文本的语言特征,旨在实现最佳的文本隐写效果。我们对所提出方法完成了建模并选用了不同类别的数据进行实验,验证了方法的有效性。
  (3)开展了基于改进评价指标的文本信息隐写方法研究。
  我们在进一步的研究过程中发现,仅仅依据马尔可夫链状态转移图中的转移概率对文本的质量进行评价不够客观和全面。在一般文本中,语言序列的长度越长,该语言序列的出现频度将呈现下降的趋势。这些长语言序列或许拥有很好的语言特征及质量,仅仅由于其出现频度较低就将其从语言模型中删除,这对于模型质量的影响是负面的。因此,我们提出了基于改进评价指标和单比特规则的文本信息隐写方法。该方法通过建立新的语句质量评价标准和模型建立基准,旨在更加客观的对文本的质量加以评判,以期实现更好的性能。我们对所提出方法完成了建模并选用了不同类别的数据进行实验,验证了方法的有效性。
  论文在最后对于所做的研究进行了总结,并对以后的工作方向及内容做以展望。
其他文献
在过程控制、流体控制、以及网络化控制等系统中,普遍存在着时滞现象和未知动态干扰,其控制问题一直是控制领域研究的热点话题。时滞和未知干扰往往是制约系统性能的主要因素,这些不确定因素通常会严重影响系统的响应速度和控制精度。因此,对于在系统中含有未知扰动、时滞等现象的研究在现阶段有十分重要的意义和价值。  自抗扰控制器(ADRC)作为一种新型控制器,具有较强的稳定性和鲁棒性,通过引入扩张状态观测器,实现
六足机器人作为一种并联机器人,因其运动方式灵活多变,稳定性强,所以其环境适应性较好,已经成为机器人中的主流产品。然而由于六足机器人腿部数量较多,使得六足机器人的控制难度增加。中枢模式发生器(CPG)的出现,为六足机器人的控制方法提供了新的思路。本文对六足机器人识别地形然后采取相应的步态规划进行研究,利用CPG控制六足机器人在地形环境中平稳行走。具体研究如下:  首先,通过研究国内外论文介绍目前六足
多智能体系统广泛存在于实际生产生活中,是控制领域的研究热点,而一致性问题作为智能体协调合作的基础,更是深受关注。受限于能源供应限制,以嵌入式微处理器为核心的多智能体系统在实际应用时约束较多,因此一致性控制协议不仅要满足性能要求,更要提高资源利用率。事件触发控制对于降低资源消耗效果显著,故而被认为是资源受限环境下的优良控制策略。再则,现有的关于事件触发控制下多智能体系统一致性问题研究的文献多是针对智
分数阶微积分是整数阶微积分的统一与延伸,是求函数的任意阶导数或积分。由于分数阶微积分算子的长记忆性和无限维等特点,使得分数阶模型可以简洁准确地描述复杂系统的动态行为。系统辨识作为分数阶系统建模的有效手段引起了很多学者的关注。目前,在分数阶系统辨识中,直接利用分数阶微分定义计算输入输出信号的分数阶微分存在计算量大,容易扩大噪声等缺点。为此,本文利用块脉冲函数的分数阶运算矩阵将函数的分数阶运算转换为代
受雾霾微粒影响,含雾图像清晰度及色彩饱和度降低,图像质量产生退化。图像去雾算法能够有效提高含雾图像能见度、改善图像视觉效果,因此具有十分重要的研究价值。结合含雾图像特征,本文着重研究了基于物理模型的图像去雾算法,主要工作如下:  (1)针对当前全局大气光估计方法存在易受极值区域影响,导致大气光估计产生偏差的问题,提出了一种基于最小方差投影的全局大气光估计方法。通过将图像沿行列方向投影,分析不同行列
学位
从地理领域文本等非结构化数据中抽取实体和关系,为构建地理知识图谱、智能问答等应用提供了重要基础。由于地理领域标注语料资源较少,难以使用深度学习等依赖大规模标注语料的方法,利用知识库中的领域知识对地理语料库进行表示增强,可以有效缓解语料不足的问题。传统神经网络模型在处理一维序列、二维网格数据时表现优异,但不能很好地处理知识库等图结构数据。现有的实体关系抽取模型不能很好地处理语料库中多元实体关系的情况
学位
目前语音合成技术使用大量的来自单个说话人的语料库训练网络模型,以合成特定人的音频信号。面对个性化的实际应用场景,现有的语音合成技术在数据资源和定制周期上存在局限性。多说话人语音合成技术作为语音合成领域的分支,能够以高效利用数据的方式为各种说话人生成符合人类听觉的语音。一般从语音自然度和音色相似度两方面,主观地评判语音合成质量。近年,谷歌提出的从说话人验证到多说话人语音合成的迁移学习方法在语音自然度
物联网设备的普及给人们的日常生活和工作提供了方便,但同时也带来了许多安全风险。近年来,利用固件中的漏洞对物联网设备进行攻击的事件时有发生,使得固件的安全问题受到了越来越多的关注。其中,跨平台的固件漏洞检测是固件安全的一个重要研究方向。由于代码复用现象的普遍存在,导致不同平台上的固件经常受到相同已知漏洞的影响。通过对跨平台的固件漏洞进行检测,可以降低同源已知漏洞对设备所造成的威胁,有助于提升系统的安
学位
现货实例定价方式是一种基于拍卖的虚拟机实例定价方式,它可以帮助云服务提供商有效处理闲置云计算资源,减轻库存压力,因此已在亚马逊弹性计算云、谷歌云和阿里云等国内外主流云服务提供商中得到较为广泛的应用。随着现货实例的逐渐普及,如何制定合理的投标策略成为越来越多云用户面临的关键问题。现有关于现货实例投标策略的研究大多围绕如何在时间约束下最大化用户利益展开讨论,较少关注用户同时面临时间与预算约束的情形,也
学位
汽车的普及在给人们的生产生活带来极大方便的同时,也造成了如交通拥挤、交通安全等一系列的社会问题,近年来兴起的智能交通则有望解决这些问题。道路交通标志是智能交通的重要环节之一,道路交通标志的检测对无人驾驶、辅助驾驶等技术具有重要的促进作用,也引起了越来越多研究人员的关注。传统的交通标志检测算法主要基于交通标志的形状、颜色等外观信息进行,且依赖于通过人工方法进行特征提取。人工提取目标特征不仅有很大难度
学位