噪声环境下的说话人识别技术

被引量 : 0次 | 上传用户:leeyongfan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人与人之间交流最直接且最有效的途径之一。语音在承载信息的同时,还包含了说话人的个性特征。说话人识别技术就是依据语音信号中能够代表说话人个性特征的参数来识别话者身份的技术。在过去的几十年里,说话人识别技术取得了很大的发展和进步。而阻碍说话人识别技术进一步走向实用的主要障碍,则是各种实际应用场景中的噪声。这些噪声极大地降低了系统的识别性能,影响了说话人识别技术的应用和推广。本文主要研究了在噪声环境下的说话人识别问题。论文主要对端点检测、信号空间的抗噪技术、特征空间的抗噪技术等方面进行了研究。本文主要研究工作包括以下几个方面:(1)低信噪比下的端点检测技术研究,首先介绍了在噪声环境下表现效果较好的两种端点检测方法:基于C0复杂度的端点检测算法、基于MFCC相似度的端点检测算法;然后在二者的基础上研究了一种新的端点检测算法:基于改进C0复杂度和MFCC相似度相结合的端点检测算法;最后对三种端点检测算法进行实验分析,证明了改进算法性能优良、稳定性更高。(2)信号空间的抗噪技术研究,首先介绍了常规的信号空间抗噪方法:谱减法、维纳滤波法、基于先验信噪比的维纳滤波法;然后在先验信噪比的维纳滤波法基础上增加端点检测环节:将基于MFCC相似度的端点检测融入到维纳滤波法中;最后对几种算法在不同信噪比环境下进行对比实验,验证了改进算法的识别性能。(3)特征空间的抗噪技术研究,首先介绍了几种常用的鲁棒性特征:梅尔频率倒谱系数及感知线性预测系数,并对上述两种特征分别进行改进;然后,对改进后的两个特征进行融合;最后,对改进前后的几种特征参数做对比实验,验证了新的特征参数具有更高的识别性能。
其他文献
本文提出交通标志应按使用对象的不同分为道路管理者使用标志,驾乘人员使用标志和两者共同使用的标志,在此基础上分析《道路交通标志和标线》(GB5768-1999)并总结近年工程实
本文从儿童核心素养发展的角度,分析了数学实践活动与儿童心理发展的关系,结合课堂、校内、校外的实践活动模拟出对应的数学场景,探讨如何利用数学实践活动培养儿童数学素养
<正>随着我国人口平均年龄的增加,人口老龄化的加剧,骨质疏松引起的椎体骨折(OVCF)的新发患者不断增加。据报道,每年全世界新发患者数超过140万[1]。为减轻患者的疼痛,加速患
当前实践活动课在小学数学教学中的开展效果并不理想,这一方面是因为没有认识到实践活动课的重要意义。另一方面是没有结合教学内容实际进行科学、合理、高效的组织。基于此,
随着社会的不断进步,工业产品的绿色安全和节约能耗是现在关注的热点,因此需要大大地减轻它们的质量,而铝合金具有密度小、比强度高和优异的耐磨性等特点,广泛地应用于航空航
民族地区教育史不仅是教育科学的一个重要研究领域,也是民族史研究的重要组成部分。民族地区教育史的发展,同该地区政治、经济、文化及社会环境息息相关,又可以折射出该地区
在法治国家中,司法权力是维护人权的坚强后盾,司法程序是人们依法理性维权的基本途径,司法机关是保障人权的责任主体,是社会公平正义的最后一道防线,保障人权是司法机关的重
本课题选用Zr46(Cu4.5/5.5Ag1/5.5)46Al8(at.%)(Zr Cu Al Ag)非晶合金为研究对象,利用微弧氧化表面改性技术对其处理,在其表面制备了出具有生物活性的涂层,通过改变微弧氧化
<正>《海淀区"十二五"商业服务业发展规划》显示,"十二五"时期,海淀北部新区定位为生态休闲服务区。根据规划,北部新区将建设成为保护地区原生态、开发空间集约化、产业园区
目的探讨男性职业足球运动员膝关节损伤的MRI表现及损伤特征。方法将2011年12月至2013年4月到本院就诊的29名男性职业足球运动员共31个膝关节损伤作为实验组,运动员年龄(23.6