论文部分内容阅读
信息隐藏是一门古老的技术,也是一门年轻的学科。早在古希腊战争中,就已经使用信息隐藏进行通信。我国古代也有很多信息隐藏通信的记载,如藏头诗、藏尾诗等。然而,直到计算机网络发展起来以后,信息隐藏才真正被重视而获得广泛的研究。计算机网络的发展应用,在极大便利了人们获取和分发信息的同时,也带来新的挑战。如何保护互联网内容版权?如何检测互联网内容是否被篡改?如何安全的在互联网传输信息?如何防止恐怖分子利用互联网传输秘密信息?一系列问题的提出,使得人们重新思考和研究信息隐藏技术。通过信息隐藏技术,在互联网内容中嵌入作者版权等信息,可以有效解决版权保护问题。通过信息隐藏技术,在互联网内容中嵌入控制信息,可以有效检测互联网内容是否被篡改。通过信息隐藏技术,将秘密信息嵌入互联网载体之中,可以使得传输信息更安全。通过信息隐藏检测技术,可以有效防止恐怖分子或敌对分子等进行秘密通信。信息隐藏技术与信息隐藏检测技术之间的关系,如同加密和解密之间的关系,是一种对立统一,既互相竞争又互相促进的关系。信息隐藏技术的发展,必然导致信息隐藏检测技术的研究;信息隐藏检测技术的进步,也必然促使更安全的信息隐藏技术的设计。信息隐藏技术有多种分类方式,其中按照载体类型,可以分为基于图像的信息隐藏技术、基于音频的信息隐藏技术、基于视频的信息隐藏技术和基于文本的信息隐藏技术等。基于文本的信息隐藏包含基于格式的隐藏、基于字体的隐藏、基于行或字符间距的隐藏以及基于自然语言本身的隐藏等。因为文本使用的广泛性,对文本信息隐藏与检测的研究将对国家安全和社会稳定有重大意义。鉴于此,本文对基于自然语言的信息隐藏与检测算法深入研究,设计了多种检测算法。另外,在自然语言信息隐藏检测研究成果的基础上,设计了更安全的自然语言信息隐藏算法。具体研究成果如下:1)设计了一种使用统计语言模型的文本信息隐藏检测算法,该检测算法可以对不同的文本信息隐藏系统(如NICETEXT、TEXTO和基于马尔可夫链的信息隐藏系统)进行检测。对不同大小的文本进行检测实验表明,本文算法对检测文本大小的要求远远低于以往算法,而且算法的检测精确度比以往算法高约10%。2)基于翻译的信息隐藏(Translation-Based Steganography,简称TBS)是一类较新的具有代表性的信息隐藏算法。在本文研究成果发表之前,尚没有有效的检测方法。本文设计了一种在知道TBS算法所使用的翻译机集合条件下的检测算法,并且对算法的有效性进行了理论分析和实验验证。结果皆表明:算法不仅可以用来分类自然语言文本和含有隐藏信息的文本(或叫隐写文本、载密文本),也可以用来区分不同翻译机的翻译文本。3)设计了一种针对TBS算法的盲检测算法一—STBS。 STBS不需要知道任何TBS的信息,包括翻译机集合、语言对等,仅需根据测试文本中单词以及词组的频率就可以区分正常文本和隐写文本。另外,本文还给出了STBS的性能优化方法以及实验测试结果。本部分内容发表在2010年国际信息隐藏大会(IH2010)上。4)构建了一种新的更安全的TBS算法(Novel Translation Based Steganography, NTBS)。本文不仅通过实验说明NTBS的安全性,并且探索了通过数学建模计算NTBS的安全性。就本文作者所了解,通过数学计算验证文本信息隐藏算法安全性尚属首次。计算结果表明,对于NTBS产生的大小为1000个句子的隐写文本,理论上最大分类准确度小于59%。本部分内容已发表在2011年国际信息隐藏大会(IH2011)上。5)设计了基于哈希的信息嵌入算法(HashHide).使用HashHide,通信双方仅需共享密钥信息,大大减少了通信双方需要共享的信息量,因此增加了系统的安全性。算法嵌入效率比同类算法提高约20%。6)根据中文文本特征,设计了基于字体的信息隐藏算法,给出了三种秘密信息嵌入方法,并对三种嵌入方式的嵌入率和嵌入效率等进行了分析比较。最后对算法的安全性进行了分析,并给出了增强安全性的手段。上述成果1)是一种通用的信息隐藏检测算法,大大提高了目前算法的检测准确率,属于方法创新;成果2)和3)是针对基于机器翻译的信息隐藏算法的检测分析,将统计自然语言处理的部分理论引入到自然语言信息隐藏检测上来,分别给出了知道隐藏系统部分信息和完全不知道任何信息情况下的检测算法,属于应用创新;成果4)设计了一种更安全的信息隐藏算法,并且通过数学计算验证算法的安全性,属于理论创新;成果5)是一种通用的信息嵌入方法,可以广泛应用于文本信息隐藏;成果6)专门针对中文特性设计的信息隐藏算法,算法比较实用且简单。