论文部分内容阅读
随着计算机科学及网络技术为主导的信息科学及产业的飞速发展,诸如窃听、重放、抵赖、信息泄露、非法使用等信息安全问题也日益凸显。相较于传统的信息加密技术,信息隐写技术可以以一种更加隐秘的方式保护重要的信息。信息隐写通常采用冗余量较大的载体完成,例如图像,音频,视频等。文本作为历史最悠久、使用量最大的媒体信息,由于冗余量较小而难以搭载太多秘密信息,但也因此更有研究价值。在本文中,我们以自然语言文本作为隐写研究对象,从不同的角度出发,对于自然语言文本隐写方法加以研究,具体研究内容和取得的工作成果如下:
(1)开展了基于变语法规则的文本信息隐写方法研究。
在研究中我们发现,不同维度的语法模型在构建过程中对于训练文本所抓取的特征不同,因此影响到最后生成的隐写文本质量。因此,我们将不同维度语法模型加以结合,以利用不同维度语法模型的各自优势。在研究中,我们提出了基于此思想的、两种不同混合语法规则的隐写模型,即基于半频交叉规则的文本信息隐写方法和基于多规则语言模型交替的文本信息隐写方法。这两种方法都是尝试在更为灵活的语言关系基础之上实现隐写文本的生成,以期待取得更好的隐写效果。我们对所提出方法完成了建模并选用了不同类别的数据进行实验,验证了方法的有效性。
(2)开展了基于转移概率的文本信息隐写方法研究。
在研究中我们突出了马尔可夫链状态转移图中转移概率的作用,并基于此思想提出了三种不同的隐写方法。首先提出了基于状态转移二进制序列的文本信息隐写方法。在该方法中,我们不仅紧紧围绕马尔可夫链中的转移概率这一概念对隐写模型进行设计,而且我们在信息通讯过程中对部分重要信息进行二次加密,进一步加强了信息的通讯安全。其次,我们提出了在模型中选择最优及次优语言序列的基于单比特规则的文本信息隐写方法,旨在将文本中较优的语言特征保存下来指导隐写文本的生成。最后,我们提出了一种基于变比特规则的文本信息隐写方法,在最大程度上保留了训练文本的语言特征,旨在实现最佳的文本隐写效果。我们对所提出方法完成了建模并选用了不同类别的数据进行实验,验证了方法的有效性。
(3)开展了基于改进评价指标的文本信息隐写方法研究。
我们在进一步的研究过程中发现,仅仅依据马尔可夫链状态转移图中的转移概率对文本的质量进行评价不够客观和全面。在一般文本中,语言序列的长度越长,该语言序列的出现频度将呈现下降的趋势。这些长语言序列或许拥有很好的语言特征及质量,仅仅由于其出现频度较低就将其从语言模型中删除,这对于模型质量的影响是负面的。因此,我们提出了基于改进评价指标和单比特规则的文本信息隐写方法。该方法通过建立新的语句质量评价标准和模型建立基准,旨在更加客观的对文本的质量加以评判,以期实现更好的性能。我们对所提出方法完成了建模并选用了不同类别的数据进行实验,验证了方法的有效性。
论文在最后对于所做的研究进行了总结,并对以后的工作方向及内容做以展望。
(1)开展了基于变语法规则的文本信息隐写方法研究。
在研究中我们发现,不同维度的语法模型在构建过程中对于训练文本所抓取的特征不同,因此影响到最后生成的隐写文本质量。因此,我们将不同维度语法模型加以结合,以利用不同维度语法模型的各自优势。在研究中,我们提出了基于此思想的、两种不同混合语法规则的隐写模型,即基于半频交叉规则的文本信息隐写方法和基于多规则语言模型交替的文本信息隐写方法。这两种方法都是尝试在更为灵活的语言关系基础之上实现隐写文本的生成,以期待取得更好的隐写效果。我们对所提出方法完成了建模并选用了不同类别的数据进行实验,验证了方法的有效性。
(2)开展了基于转移概率的文本信息隐写方法研究。
在研究中我们突出了马尔可夫链状态转移图中转移概率的作用,并基于此思想提出了三种不同的隐写方法。首先提出了基于状态转移二进制序列的文本信息隐写方法。在该方法中,我们不仅紧紧围绕马尔可夫链中的转移概率这一概念对隐写模型进行设计,而且我们在信息通讯过程中对部分重要信息进行二次加密,进一步加强了信息的通讯安全。其次,我们提出了在模型中选择最优及次优语言序列的基于单比特规则的文本信息隐写方法,旨在将文本中较优的语言特征保存下来指导隐写文本的生成。最后,我们提出了一种基于变比特规则的文本信息隐写方法,在最大程度上保留了训练文本的语言特征,旨在实现最佳的文本隐写效果。我们对所提出方法完成了建模并选用了不同类别的数据进行实验,验证了方法的有效性。
(3)开展了基于改进评价指标的文本信息隐写方法研究。
我们在进一步的研究过程中发现,仅仅依据马尔可夫链状态转移图中的转移概率对文本的质量进行评价不够客观和全面。在一般文本中,语言序列的长度越长,该语言序列的出现频度将呈现下降的趋势。这些长语言序列或许拥有很好的语言特征及质量,仅仅由于其出现频度较低就将其从语言模型中删除,这对于模型质量的影响是负面的。因此,我们提出了基于改进评价指标和单比特规则的文本信息隐写方法。该方法通过建立新的语句质量评价标准和模型建立基准,旨在更加客观的对文本的质量加以评判,以期实现更好的性能。我们对所提出方法完成了建模并选用了不同类别的数据进行实验,验证了方法的有效性。
论文在最后对于所做的研究进行了总结,并对以后的工作方向及内容做以展望。