论文部分内容阅读
模仿者蓄意模仿说话人的语音,当相似度很高时,模仿者就很有可能欺骗身份鉴别系统,并获得相应的权限来侵入系统,对信息安全和个人隐私造成严重威胁。因此,进行语音蓄意模仿的分析研究对国防、信息安全及刑侦等均具有重大意义。 本文对语音反蓄意模仿进行了语音增强、特征参数提取研究,并建立了基于SVM的反蓄意模仿说话人识别系统,主要内容如下: (1)本文介绍了蓄意模仿的相关概念以及研究现状,举例分析了语音蓄意模仿对社会和信息安全的危害。从说话人识别系统的全局着手,分析了语音预处理的重要性,简单说明了特征参数提取,介绍了常见的说话人识别模型,并对其进行分析。 (2)语音信号不可避免地受到各种环境噪声的影响,为了提高系统的识别率,要对语音进行增强处理,提取尽可能纯净的语音。本文利用小波阈值去噪方法对含噪语音进行去噪,结合并改进传统的软硬阈值去噪方法,提出了一种新阈值函数去噪方法,取得了良好的去噪效果。 (3)对MFCC倒谱系数及其差分倒谱系数进行了详细阐述,为了获取更具个人语音特性的特征参数,提取了WMFCC和IWMFCC,同时提取了DWTWC语音特征参数。根据增减分量法原理,提出MFCC+△MFCC、 MWI-MFCC和DWI-MFCC混合特征参数。 (4)建立了蓄意模仿语音库,并介绍语音相似度主客观评价方法;研究MFCC、MFCC+△MFCC、MWI-MFCC和DWI-MFCC倒谱系数对语音蓄意模仿的分辨能力,以及它们对语音蓄意模仿相似度的描述能力。实验表明,这四种特征参数中DWI-MFCC倒谱系数性能最好。 (5)详细介绍了支持向量机的基本原理,建立了基于SVM的语音反蓄意模仿识别系统,并与基于VQ的说话人识别系统作比较,错误接受率从VQ系统的12.25%降低到SVM系统的6.4375%,证明了本文建立的系统具有更优良的性能。 (6)对本文的工作进行总结,并提出下一步的研究方向。