基于小波分析的说话人识别研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:oupser123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是一种生物识别技术.通过对采集到的语音信号提取相应的特征,建立相应的模型,然后判断说话人身份.说话人识别在电子商务和和信息安全等领域具有广泛的应用前景.该文首先介绍了说话人识别技术的发展现状和声学基础,详细论述了语音信号的产生原理及其数字模型;同时也阐述了人耳听觉感知的特性以及Mel刻度在语音信号处理中的作用.然后,对小波理论进行了详细地介绍,并且论述了小波分析在对语音信号处理中有很好的效果.接着,介绍了说话人识别系统中的语音特征参数提取部分,重点阐述了MPCC参数的提取,并在此基础上,引入了小波包分析来逼近人耳的听觉感知特性,并且在增加了一个小波系数的降噪步骤,从而提出了一种新的语音特征参数—"基于小波的子代特征参数"(SFBW).跟着,介绍了几种说话人识别的模型,如动态时间规整DTW、矢量量化VQ、隐马尔可夫模型HMM等、重点阐述了高斯混合模型GMM,以及其改进型—正交高斯混合模型(OGMM),并且论述了OGMM模型相对于GMM计算量减小的特点.实验是以一个30人的语音库为基础,Matlab为主要的实验平台,建立了一个与文本无关的说话人识别系统.通过实验结果,对比了MFCC参数和SFBW参数在不同噪声情况下的性能,同时也对比了GMM模型和OGMM模型对说话人识别的效果.最后,重点分析研究了小波分析对说话人识别系统的优势及其鲁棒性.并对说话人识别今后研究的重点和方向提出了建设性的建议.
其他文献
期刊
期刊
视频拼接技术作为计算机视觉和计算机图形学两个学科上的交叉研究领域,在近年来得到了极大的关注,成为这两个互补领域的研究焦点之一.视频拼接技术广泛应用于虚拟现实、电影
期刊
期刊
及时、准确获取网络内部各条链路的时延和带宽利用率信息,以便实时、充分了解网络的状态,是资源管理、拥塞控制、多路径路由等网络管理与控制手段的关键之一。高速IP网络要求测
期刊
随着计算机网络的迅速发展,计算机网络已经从传统的集中应用环境发展成为分布式应用环境。目前常用网络管理系统产品实现都是基于Internet的综合了SNMP和RMON管理技术或基于OS
期刊
移动通信越来越广泛地渗透到每个人的生活当中,同时人们对各种业务需求的日益增长,也推动了移动通信的飞速发展.第三代移动通信系统(3G)以码分多址(CDMA)作为多址接入方式,具