论文部分内容阅读
随着计算机技术、多媒体信息技术和网络通信技术的迅猛发展,语音作为声音信息数字化传播和知识积累过程中的主要载体,已逐渐成为人类获取信息的重要来源,然而网络、宽带以及无线等通信信道的开放性,为窃听、恶意篡改等非法攻击提供了可乘之机。语音多媒体信息的内容安全认证迫在眉睫,有必要对语音感知内容的真实性和完整性进行客观验证。 因此,论文结合带宽资源受限的移动计算环境语音通信终端的语音通信问题,采用语音感知哈希和小波变换技术重点对语音内容的内容完整性与真实性、算法的高效性以及小范围篡改定位检测等进行了研究。主要研究内容如下: 1.资源受限的语音通信终端对感知哈希算法的效率和功耗都有很高的要求,这就要求感知哈希算法在保持良好的鲁棒性和区分性的前提下,能使认证数据量小,效率高,并能对恶意攻击具有高敏感性。因此,提出了一种基于小波包变换的高效语音感知认证算法。该算法在保持有良好感知鲁棒性和区分性的同时,摘要性强、认证效率较高。另外,为实现篡改定位检测以及提高算法的高效性,对数据的不同进制系统进行了研究,提出了一种基于离散小波变换和对称三进制串的语音感知认证算法。该算法在保持与基于小波包变换的高效语音感知认证算法性能相近的同时,实现了准确的篡改检测与定位,认证效率大幅度提高。通过对不同进制的感知认证系统进行对比研究,比较了不同进制系统的优劣性。 2.针对目前音频认证算法认证音频格式单一、认证算法不通用、认证效率低的问题,提出了一种新颖的基于双树复小波变换的多格式音频感知哈希算法。该算法首先在双树复小波变换域对实小波系数提取帧间Teager能量算子的模值特征和帧内对数短时能量特征,对复小波系数提取帧间熵值特征,然后对模值、对数短时能量和熵值特征向量进行哈希构造生成感知哈希序列,最后通过哈希匹配实现了对不同格式音频内容的快速认证。实验结果表明,算法对 WAV、MP3、FLAC、OGG和M4A五种不同格式的音频都具有较好的通用性、较强的鲁棒性和区分性,算法整体复杂度低,能够满足音频通信终端实时认证的要求,且能实现小范围篡改检测。同时研究结果表明,该算法对研究多格式音频的通用感知哈希认证算法具有一定的启发意义。