论文部分内容阅读
说话人识别是一种生物识别技术.通过对采集到的语音信号提取相应的特征,建立相应的模型,然后判断说话人身份.说话人识别在电子商务和和信息安全等领域具有广泛的应用前景.该文首先介绍了说话人识别技术的发展现状和声学基础,详细论述了语音信号的产生原理及其数字模型;同时也阐述了人耳听觉感知的特性以及Mel刻度在语音信号处理中的作用.然后,对小波理论进行了详细地介绍,并且论述了小波分析在对语音信号处理中有很好的效果.接着,介绍了说话人识别系统中的语音特征参数提取部分,重点阐述了MPCC参数的提取,并在此基础上,引入了小波包分析来逼近人耳的听觉感知特性,并且在增加了一个小波系数的降噪步骤,从而提出了一种新的语音特征参数—"基于小波的子代特征参数"(SFBW).跟着,介绍了几种说话人识别的模型,如动态时间规整DTW、矢量量化VQ、隐马尔可夫模型HMM等、重点阐述了高斯混合模型GMM,以及其改进型—正交高斯混合模型(OGMM),并且论述了OGMM模型相对于GMM计算量减小的特点.实验是以一个30人的语音库为基础,Matlab为主要的实验平台,建立了一个与文本无关的说话人识别系统.通过实验结果,对比了MFCC参数和SFBW参数在不同噪声情况下的性能,同时也对比了GMM模型和OGMM模型对说话人识别的效果.最后,重点分析研究了小波分析对说话人识别系统的优势及其鲁棒性.并对说话人识别今后研究的重点和方向提出了建设性的建议.