基于融合基频特征的声纹识别技术研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:hxlatxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声纹识别,也称说话人识别,它是通过对说话人的语音信号进行分析,而对说话人进行确认(Verification)或鉴别(Identification)的一种技术,已经在安全支付、声纹解锁、公安刑侦等许多信息安全领域得到成功和广泛的应用。人的声音所具有的特征分为声道特征和声门特征两类,传统的声纹识别技术是基于人的声道特征的,在理想的语音录制环境中能取得较好的识别效果。但是,传统声纹识别技术使用一种或两种声道特征,在噪声环境下识别性能下降。因此,本文研究基于融合人的声门特征的声纹识别技术。文章的主要研究工作如下:  1.分析了语音信号处理中的加窗分帧、端点检测的方法,并对传统的端点检测方法进行了改进,增加短时能量的变化幅度作为端点检测的一个门限。与传统方法相比,该方法降低了端点检测算法对噪声的敏感程度,提高了算法的适应性。  2.本文研究语音信号中梅尔倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)的提取算法,并进行了改进,降低其对噪声的敏感程度。  3.针对传统基频提取算法中易产生倍频、半频错误的问题,本文结合倒谱分析,改进了归一化自相关函数的基频提取算法。仿真实验表明,与传统算法相比,该算法较好地解决了半频、倍频错误问题,并拟合成比较平滑的基音曲线,结果准确可靠。  4.最后将基频特征和MFCC融合,研究了基频特征的短时融合模型和一种基于基频特征的倒谱补偿模型,并分别进行了基于融合基频特征和矢量量化模型的仿真实验、基于融合基频特征和高斯混合模型的仿真实验,并将它们与基于MFCC的声纹识别实验进行比较,仿真结果显示基于融合基频特征的倒谱补偿模型能较好地提高了声纹识别的准确度。
其他文献
高维数据索引机制是医学图象库基于内容检索的重要课题。作者在“国家数字化医学影像设备工程技术研究中心”的资助下,从事此方面的研究工作,取得了以下进展: 对数据分布的精
图像识别在军事国防以及民用领域的作用日益显著。近些年,从遥感和航拍图像中实现目标的自动识别取得了长足的发展,但目前仍没有一种可以普遍适用的方法。这其中的困难不仅体现
传统工业控制通常以工控机为硬件平台来构建监控系统,这种模式的监控系统存在成本高、体积大、安装及后期维护复杂等缺点。随着微处理器运算、处理能力日益强大,同时随着嵌入式
信息技术的快速发展为网络教学提供了广阔的前景。网络教学作为一种新的教学方法,改变了传统教学方式,提高了教学效果及学生参与教学活动的积极性。与传统的教学模式相比,网络教
在自然语言理解领域,词义消歧(Word Sense Disambiguation-WSD)是基础研究课题,也是重点和难点之一。作者在统计的框架下,多方面地考察词义消歧问题,得到了一些较好的结论,并在此
文件同步分为三个阶段。一是更新检测阶段,检测和发现文件的变化。二是同步决策阶段,决定如何进行文件同步,获得文件同步的具体步骤。三是同步实施阶段,进行具体的数据传输,完成文
面向奥运新闻机器翻译的中文分词研究与实现随着信息时代的到来,“信息爆炸”成为信息处理领域的瓶颈问题,不同语种之间大量的信息交流更加大了问题的严重性。不同语言之间的翻
通信网络的信道是一个开放性信道,它在赋予用户通信自由的同时也给通信网络带来一些不安全性因素。伴随着VoIP的广泛使用,它在给用户带来廉价、方便、功能丰富的语音通信功能的
随着P2P计算模式的兴起和Internet端系统计算能力的迅速增强,原先被忽视的终端用户设备成为一种宝贵的资源。如何充分利用这些终端用户设备,在动态的P2P网络环境中对海量数据进
Internet搜索已经成为Web上最重要的应用之一,人们经常需要到Google、Baidu等搜索引擎去查找想要的信息,对于科研人员更是如此。为了开展研究,他们需要到网上查找相关的文献信息