基于稀疏表示的短语音说话人识别

来源 :电子科技大学 | 被引量 : 7次 | 上传用户:qq1094795388
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术是指利用说话人的语音特征来辨别他们的身份,属于生物认证技术的范畴,广泛应用于司法鉴定、互联网安全,军事国防等领域。说话人识别技术在实用化过程中还存在诸多问题,其中短语音条件下的训练识别问题受到人们广泛关注。当语音数据充足时,现有说话人识别方法已经取得良好的识别效果,但是当语音数据有限,特别是训练和识别语音长度都在10s左右,系统识别性能明显下降。这是因为主流的说话人识别方法大多基于概率统计模型,而这种模型训练需要大量的语音数据。本文主要针对说话人识别的短语音问题,从识别模型出发展开研究,本文的主要工作包括:1.通过分析稀疏表示的分类原理以及处理有限数据的能力,将稀疏表示理论引入短语音说话人识别。首先,寻求待测语音在训练语音构成的稀疏字典上的最稀疏的线性表示,然后利用表示系数重构原始信号,根据重构的残差进行分类。接着介绍主流的l1范数最小化算法,通过实验估计其识别性能。2.针对稀疏编码模型对编码残余的高斯分布假设,分析在实际环境中,这种假设不能有效地描述重构残差。本文引入稳健回归思想,放宽对重构残差的分布约束,通过假设重构残差和表示系数独立同分布,将稀疏编码问题转化为稀疏约束下的稳健回归问题,我们称其为稳健稀疏表示模型。实验表明该方法能够更加有效地估计重构残差,提高了系统的鲁棒性和识别性能,最佳识别率可达99.31%。3.深入研究稀疏表示分类器的工作机制,经过分析得出在识别任务中做出贡献的除了稀疏性约束,还有利用所有训练样本联合表示测试样本的联合表示特性。稀疏性约束在识别任务中的功能主要表现在使得与测试样本相同类别的子字典能够用更少的样本准确表示测试样本,这要求训练语音数据充足,而短语音识别任务不能满足这个条件;另一方面,稀疏表示中的l1范数的稀疏约束计算成本较高,严重影响系统的实时性。针对稀疏约束的不足,引入正则化最小二乘思想,提出基于联合表示的说话人识别方法。这种方法不仅有效地提高系统的识别率,识别速度也有极大的提高,识别单个样本在0.045s左右。
其他文献
随着社会的快速发展,母婴保健事业既受到政府的高度关注与重视又受到我国相关法律法规的支持,即我国相关法律文件清晰指出政府在母婴保健事业中应尽的职责,而事实上,母婴保健事业
在非合作通信中,由于侦察方未知通信方采用的信道编码参数,需要通过截获的码字完成对信道编码参数的盲估计,以实现对信息的获取。本文针对代数编码的参数盲估计进行研究,主要取得
计算机技术发展到今天,嵌入式系统的应用越来越广泛,嵌入式计算机在应用数量上远远超过了各种通用计算机。嵌入式系统是继IT网络技术之后,又一个新的技术发展方向。由于嵌入式系
设计性能逼近信道容量、编译码复杂度较低的实用好码是信道编码领域中最重要的工作之一。基于图模型的LDPC码是一种有较低的迭代译码复杂度和接近Shannon容量限的渐近好码。
集群通信系统(TRS)是一种指挥调度系统,在各个领域得到了广泛的应用.在本论文中,针对双工车载电台设计了自适应信道均衡器(ACE)和自适应回波抵消器(AEC),并进行了仿真和性能
信息时代的今天,电子信息产业发展迅速,推动了电信网络的不断壮大。而人们对于随时随地沟通的需求日益强烈,从而对通信网络的依赖性遍布了生活中的各个角落。网络故障的产生,轻则
随着网络技术和数据通信技术的飞速发展,多媒体数据对人们的生活产生了越来越重要的影响,因而,对数字产品的版权保护也就成为当今国际上研究的一个热门课题。数字水印技术作为版
本文研究了高速路由器中队列管理算法以及对其进行改进,文章的第一章是绪论部分,主要介绍课题的背景及意义,并在此基础上提出了解决网络拥塞的方向:第二章主要分析了Internet网络
目的:探究环磷酰胺冲击配合激素在治疗难治性肾病综合征中的临床疗效。方法:选择医院自2015年1月-2016年1月接受治疗的难治性肾病综合征患者90例,在患者及其家属知情的情况下,随
短波/超短波无线通信具有发射所需功率小,设备成本低等特点,同时其通信线路不容易被破坏,在军用领域有着良好的发展前景。无线通信系统的目标是提供普遍适合的,高质量以及高速率的