论文部分内容阅读
随着现代语音通信技术的不断进步,移动语音通信技术在人类信息交流方式中发挥着举足轻重的作用。语音信息在移动环境下进行传输,会受到噪声、恶意篡改等攻击,移动计算环境下语音传输信道开放、传输资源有限,移动终端处理能力、续航能力不足等问题与语音传输安全需求的矛盾越来越突出。因此,对移动计算环境下的语音内容安全认证的研究是很有必要的。 论文结合带宽资源受限、终端处理能力有限的移动计算环境语音通信终端的语音通信问题,从原始域和压缩域语音入手,采用语音感知哈希认证技术,重点对语音的内容完整性与真实性,算法的高效性与鲁棒性,小范围篡改定位检测,以及语音编码在语音感知哈希中的应用等几个关键问题展开研究。具体工作如下: 1.针对移动计算环境下语音感知哈希算法没有通用模型的问题,对认证模型进行了研究,提出了一种移动计算环境下语音感知哈希的认证模型。该模型通过对多媒体感知哈希认证一般模型的研究,以语音感知签名为基础,结合多媒体感知认证算法,并基于移动计算环境下这个应用背景,分析移动计算环境下语音信号处理和传输特点,建立了完整的移动计算环境下语音感知哈希算法认证模型,为算法的设计提供了理论基础。 2.针对现有的语音认证算法认证效率低,算法复杂,不能够满足移动计算环境下语音通信实时认证的现状,从减小算法构成复杂度、提高算法鲁棒性、提高认证效率的应用角度,分别研究了原始域和压缩域语音的感知哈希认证算法。(1)提出了一种高效的基于线性预测分析的语音感知哈希认证算法,该算法基于语音信号的线性预测分析的原理对 LPC系数进行优化,融合能量与 LPC系数,构成新的特征系数,并对构成的特征系数阵进行分解和量化,形成感知哈希序列。(2)提出了一种基于线性预测倒谱系数的语音感知哈希认证算法,算法通过对语音信号 LPCC系数矩阵构建,并对系数矩阵进行参数规整处理,参数规整能够有效地提高抵抗高斯白噪声的鲁棒性,再对参数矩阵进行非负矩阵分解、量化,形成感知哈希序列。(3)提出了一种基于MDCT系数的压缩域语音感知哈希认证算法,算法通过对 MP3格式的语音进行部分解压,提取 MDCT系数,对每帧语音的MDCT系数进行Mel滤波处理,形成MFCC系数向量,并对系数矩阵进行分解,降低矩阵维度,经过哈希构造生成感知哈希值。(4)提出了一种基于张量重构和张量分解的语音感知哈希算法。该算法是从三维角度来分析语音感知特征,通过小波包变换得到语音各分量,对每个语音分量提取MFCC和△MFCC特征,构建语音特征张量,使用张量分解对特征张量进行分解,降低特征张量的复杂度,经过特征矩阵量化生成感知哈希值来实现语音认证。实验结果表明,所提出的四种算法对于内容保持操作均具有良好的鲁棒性,并且运算效率高,时间开销小,能够满足移动计算环境下的语音通信实时性的要求,实现语音快速认证功能。 3.针对现有语音认证算法对内容保持操作具有较强的鲁棒性,但对小范围篡改攻击不具有敏感性,认证粒度无法满足定位精度的问题。具体做了两个方面的研究。(1)从衡量感知相似度评价方法角度,提出了一种衡量感知相似度的评价方法。该方法运用Pearson相关系数来计算每帧语音感知特征的相似程度,并对系数进行归一化,再分别计算最大归一化系数和最小归一化系数的乘积,最后用乘积的比值作为语音感知相似性的测度。(2)从提高语音感知哈希算法的鲁棒性和识别小范围篡改定位的能力角度,利用人类听觉模型提出了一种自适应语音感知哈希算法。该算法首先基于人类听觉特性,对 MFCC算法每帧的滤波器数量进行控制,得到每帧语音的自适应Mel频率倒谱参数,对AMFCC参数和LPCC系数进行融合,并采用分块方法对特征矩阵进行处理;然后对特征块进行2DNMF运算,降低特征矩阵的复杂度;最后对分解后的系数矩阵进行哈希构造,得到语音感知哈希值。实现结果表明,该算法能够对内容保持操作具有鲁棒性,能够定位小范围篡改的位置,定位精度可以达到40ms。 4.为了满足带宽资源受限的语音通信环境中语音认证对低数据量、低复杂度的要求,提出一种与 G.729编码标准相结合的鲁棒语音感知哈希算法。该算法在G.729语音编码过程中通过提取线性预测残差作为语音感知特征,并通过量化得到感知哈希值。线性预测残差作为线性预测系数的衍生技术能够较好的提高预测系数的鲁棒性。实验结果表明,该算法对常见的语音传输操作具有较好的鲁棒性和区分性,算法的时间复杂度低、效率高,能够有效地辨别内容保持操作和恶意篡改攻击,并能够保证篡改定位的精度。