基于小波分析的说话人识别研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户：oupser123

【摘要】

：

说话人识别是一种生物识别技术.通过对采集到的语音信号提取相应的特征,建立相应的模型,然后判断说话人身份.说话人识别在电子商务和和信息安全等领域具有广泛的应用前景.该

【作者】

：

廖昊星

【机构】

：

华南理工大学

【出处】

：

华南理工大学

【发表日期】

：

2004年期

【关键词】

：

说话人识别小波包分析 MFCC参数子带特征参数高斯混合模型正交高斯混合模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

说话人识别是一种生物识别技术.通过对采集到的语音信号提取相应的特征,建立相应的模型,然后判断说话人身份.说话人识别在电子商务和和信息安全等领域具有广泛的应用前景.该文首先介绍了说话人识别技术的发展现状和声学基础,详细论述了语音信号的产生原理及其数字模型;同时也阐述了人耳听觉感知的特性以及Mel刻度在语音信号处理中的作用.然后,对小波理论进行了详细地介绍,并且论述了小波分析在对语音信号处理中有很好的效果.接着,介绍了说话人识别系统中的语音特征参数提取部分,重点阐述了MPCC参数的提取,并在此基础上,引入了小波包分析来逼近人耳的听觉感知特性,并且在增加了一个小波系数的降噪步骤,从而提出了一种新的语音特征参数—"基于小波的子代特征参数"(SFBW).跟着,介绍了几种说话人识别的模型,如动态时间规整DTW、矢量量化VQ、隐马尔可夫模型HMM等、重点阐述了高斯混合模型GMM,以及其改进型—正交高斯混合模型(OGMM),并且论述了OGMM模型相对于GMM计算量减小的特点.实验是以一个30人的语音库为基础,Matlab为主要的实验平台,建立了一个与文本无关的说话人识别系统.通过实验结果,对比了MFCC参数和SFBW参数在不同噪声情况下的性能,同时也对比了GMM模型和OGMM模型对说话人识别的效果.最后,重点分析研究了小波分析对说话人识别系统的优势及其鲁棒性.并对说话人识别今后研究的重点和方向提出了建设性的建议.

其他文献

浅识腰椎间盘突出症的中医治疗

期刊

血液灌流联合血液透析患者的护理体会

期刊

视频图象序列的多维拼接方法的研究

视频拼接技术作为计算机视觉和计算机图形学两个学科上的交叉研究领域,在近年来得到了极大的关注,成为这两个互补领域的研究焦点之一.视频拼接技术广泛应用于虚拟现实、电影

学位

视频拼接角点检测图象配准虚拟现实

阿德福韦酯联合医用臭氧治疗慢性乙型肝炎的疗效观察

期刊

柴胡建中汤加减治疗功能性腹痛36例