声纹识别系统中特征参数提取方法的对比分析研究

来源 :成都理工大学 | 被引量 : 11次 | 上传用户:isaxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声纹识别同虹膜识别、人脸识别、指纹识别一样属于生物识别,而且都是利用个人的生物特性来进行身份识别的。因为声纹识别的经济性和便利性,其发展前景非常广阔。声纹识别区别于语音识别,前者是通过语音的个性特征来识别人的身份,后者却是识别说话人语音的内容。由于每个人说话的语音特征都是不同的、独一无二的,而且极难被人模仿,所以采用声纹对说话人进行身份识别要较其他生物识别更加准确。声纹识别的过程就是从说话人的语音信号中选择出一段语音,然后从这段语音中提取出能代表该个体的个性特征的参数,进而达到确认说话人身份的目的。本文主要是对与文本无关的声纹识别系统的研究,与文本无关是指在进行语音提取时,说话人不需要输入固定的语音样本,可录入任意一句语音。本文依据声纹识别系统的研究现况,着重研究了该系统中的特征参数的提取方法。现在比较常用的声道特征参数包含线性预测系数(LPC)、线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC),对MFCC参数进行了一阶差分得到了MFCC_D参数,实验表明该参数达到的识别率优于MFCC参数。在对Mel滤波器组进行了研究发现其在高频处的计算精度较低,所以提出了一种基于混合Mel滤波器组的MFCC参数的提取方法,即将翻转后的Mel滤波器组与Mel滤波器组进行组合得到一个即使是在高频处也能有良好计算精度的混合滤波器组,实验证明其识别率得到了提高。我们知道语音信号是由声道响应和声门特性组成的,而MFCC参数能良好的反映声道特性,基音周期能良好的反映声门特性,故提出了一种能良好反映声道特性和声门特性的特征参数,即基于基音周期的MFCC参数。其中基音周期的提取方法有多种,包括短时自相关函数法(ACF)、短时平均幅度差函数法(AMDF),并且根据ACF和AMDF提出了一种加权的ACF法,即将短时平均幅度差函数先倒数后平方,然后加权到短时自相关函数上,加权实际上是将二者相乘起来。对这几种算法进行研究,得出基音周期。不同算法提取出的基音周期有所差别,与MFCC参数结合后的参数就会不同。本文对语音的预处理和声纹识别中的识别方法进行了一些研究。在进行预处理时包括采样与量化、预加重、加窗与分帧和端点检测。其中端点检测在预处理期间是比较重要的,它是对语音信号起始点的判断,区分语音信号和非语音信号,有效的端点检测技术不仅能够快速检测出信号起始点,大大节约了检测时间,还能够排除其他无关声段,提高了识别性能。本文采用的是双门限端点检测法,即把短时能量法和短时平均过零率法两者进行结合,使其能更好的判断出信号的起始点。在识别方法上采取了高斯混合模型,该模型使用于与文本无关的声纹识别系统,介绍了GMM模型参数的估计、GMM模型参数初始化和GMM模型训练流程。在参数估计时,采用的是EM算法;参数初始化阶段采用的是K-means算法。本文主要是对特征参数提取的方法进行研究,使用高斯混合模型通过实验的方式对特征参数提取的不同算法进行分析比较,实验表明新提出的特征参数提取方法在识别率上有不同程度的提高,达到了提高声纹识别系统的识别率的目的。本文还未过多的涉及到噪声环境背景下的声纹识别技术,在未来的研究中会进一步探索声纹识别系统中的去噪处理。
其他文献
城市是人类社会进步的产物,也是文明的汇聚地。"新型生态城市"是一种科学的理念,它将整个城市看作是一个大的系统,在能量转化和各种因素的平衡下,注重城市各系统"生态链"的组
文章对我国煤炭勘察设计(咨询)企业面临的内外部环境进行分析,提出要找出发展的机遇,应认真研究对策,采取合理的发展战略。
采用个案分析法分析了耐克实施体验营销的五种策略:感官式体验营销、情感式体验营销、思考式体验营销、行动式体验营销、关联式体验营销;并提出耐克体验营销对国内体育用品营
<正>春分时节,如期而至的沙尘为地处塔克拉玛干沙漠西缘的新疆喀什蒙上一层薄纱,却无法阻挡跃上枝头的暖暖春意,催促着这片沙漠绿洲率先步入春耕备耕的忙碌时节。在巴楚县琼