论文部分内容阅读
二十世纪九十年代以来,随着Internet和多媒体技术的发展,数字化作品呈现出海量的增长势头,其传播量呈指数式扩张.这使得古老的隐写术重新找到了附着的载体,并产生了一新的学科研究方向——信息隐藏,现在,信息隐藏已经是信息安全领域的一个重要关注焦点.数字化音频的信息隐藏是信息隐藏的重要方面。由于数字化音频,特别是数字音乐及语音通信,更贴近大众生活,因而与数字化音频相关的信息隐藏具有良好的应用前景.音频的信息隐藏不但可以被用于机要谍报部门的秘密通信,也可以被用于个人隐私保护、Internet安全利用、数字作品权利保护等民用目的,因而它的研究不但具有实用性和社会经济价值,而且具有国家安全的意义。语音是音频的重要分支,对语音类音频的信息隐藏研究需要结合语音特性的研究,因而不可避免地会与语音识别的知识发生交叉。语音识别技术的方法与成果可以与信息隐藏的研究结合,服务于信息安全的应用范畴。对识别技术及音频信息隐藏的信息安全应用进行探索,研究他们的实用领域和应用场景,对其实现经济价值具有重要意义。本文从信息隐藏的视角来看待语言的交流过程,揭示了语音识别与音频信息隐藏的类比相关性。本文进行了音频信息隐藏的研究及其与语音识别相关的交叉研究,取得了以下的创新性研究成果:1.提出了利用汉语语音端点后冗余的信息隐藏方法。汉语的音节末尾的音素基本都是浊音。在声学处理上浊音可以理解为准周期的脉冲串对声道激励所产生的输出。汉语语音的这个特性被用来做语音的端点检测,以区分“有声和无声”。本文则利用这种端点检测方法,确定语音的时域周期冗余,并利用冗余实现了信息隐藏。2.提出了利用美尔频率倒谱系数(MFCC)的信息隐藏方法。MFCC是语音识别的重要参数。为利用MFCC做隐藏点,本文解决了三个难点:(1).MFCC参数选取准则。(2).如何从改变过的MFCC参数逆向求解对数能量。(3).如何进行美尔频率滤波器组的逆向求解。在此基础上,实现了利用MFCC的信息隐藏。3.提出了一种在高级音频编码AAC中进行信息隐藏的方法。由于AAC过程中存在有使用不同码书进行压缩试算的步骤,因而可以利用比例因子频段内频域量化值经不同霍夫曼码书编码后得到相等的最优长度比特的存在概率,以码书的选择作为0、1比特的隐藏方法.4.利用“绝大多数语音识别系统在嗓音环境中的性能都不可避免地急剧下降”的噪声环境的识别研究结论及汉语发音时长短等特点,构建了汉语语音验证码,为网上银行公共客户登录提供可选择的安全性解决方案,并重点解决了合成速度与WEB应用匹配问题。这是语音识别成果在本文的一个重要信息安全应用。5.成功尝试了音频水印和语音识别的结合应用。在自动语音服务中,用创新点1的方法在自动语音中嵌入水印,客户语音终端通过对水印的检测完成对自动语音的确认,并通过调起语音识别引擎,完成客户语音和自动语音的交互。目前,音频信息隐藏技术的研究还具有非常广阔的空间,特别是针对格式音频媒体的隐藏、结合识别技术的隐藏和结合低码率语音编码技术的隐藏。另外,我们还要加强语音识别和音频信息隐藏的领域应用和综合应用研究。