低信噪比下GMM-UBM的说话人识别系统的研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:pudding_dophin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于数字信息与互联网的蓬勃发展,个人信息不断泄露,使得身份认证成为了日益被人们所重视的问题,而说话人识别作为其中一种身份认证方式,有着成本低、便于移植、无需接触、方便高效等优点,在刑事侦查、电子商务等领域都有巨大的发展潜力。  虽然目前在实验室安静的背景下,说话人识别能够取得非常好的成果,可实际还存在着许多比如噪声干扰等问题,本文从整个识别系统整体着手,先概述系统由哪些环节构成以及这些环节的重要性,接着详细描述这几个环节的原理以及运算过程,本文具体研究内容以及创新如下:  (1)因为语音传输到识别系统的过程中或多或少总会受到噪声的干扰,使得语音的可懂度有所下降,因此本文研究在不同噪声环境下通过基于压缩感知的算法来给语音进行去噪处理。  (2)由于输入的语音信号不只是包含有效的语音段,并且在语音段之外还有噪声段或者无声段,这必然会给系统带来识别的误差,而且运算上也会加大负担。为此本文提出一种TEO与频域上的分形维数相结合的互补性两级判决的端点检测方法,能够在低信噪比下准确切分出有效语音的起止端点。  (3)本文研究能够表征说话人声音的特征参数MFCC以及TEO能量,通过计算出静态特征以及动态特征并将它们结合在一起,采用增减分量法来抽取对系统贡献度高的特征分量进行重新组合并分别加权,从而得到能够囊括说话人声音特征的组合参数。  (4)分析GMM-UBM模型原理以及其参数估计,并建立GMM-UBM说话人模型,利用该模型来训练以及识别。本文首先把所有人的语音通过EM方法训练成一个UBM,接着通过MAP方法从这个UBM中加入某个人的语音来一起运算,并得到代表这个人的GMM模型,同理得到每个人的GMM模型之后,识别阶段就能够把待识别特征与之前训练好的UBM以及GMM共同运算得到识别结果。在最后通过实验证明本文在各环节的研究成果。
其他文献
随着加工行业对电机运行性能要求越来越高,电机的高性能控制成为研究热点。本文通过对永磁同步电机工作原理、特点的学习,建立数学模型。提出了滑模非线性PID控制这一算法,并运用这一算法建立三相永磁同步电机的运动控制的数学模型。根据模型需要,给出了电感、永久磁通和转角速度辨识算法,从而实现了无速度传感器的观测。给出运动方程,基于无传感器辨识参量,通过MATLAB进行仿真,并对结果进行分析。最终验证控制算法
人脸表情是人类交流的一种必不可少的方式,通过对人脸表情的研究可以探索人类的心理状态,进而充分的了解人们的行为意图。深度学习是一种特征学习方法,通过一些简单的非线性
煤炭是火电厂生产的主要燃料来源,在保证安全的情况下,火电厂只有尽量缩减成本,才能提升经济效益。本文介绍了火电厂功率-煤耗表达式的拟合方法,并给出具体拟合实例。在获得煤耗特性曲线之后,以电厂总发电煤耗最小为目标,结合机组上下限约束,功率平衡约束,建立厂级经济负荷分配模型。选取动态规划方法求解该模型,详细介绍了该算法的概念,计算步骤,并给出求解实例。在经济负荷分配模型的基础上,建立机组组合模型。该模型
油冷却器是电力系统中普遍使用的一种冷却设备,同时它也适用于冶金、化工、矿山、轻工和重工等部门。利用该设备可使具有一定温差的两种介质实现热交换,从而达到降低油温,保证设
近年来,随着我国经济持续、稳定、有计划的发展,我国人民生活水平总体上达到了小康水平,居民拥有小汽车的数量逐年增加。而停车位增加的数量与汽车增加量严重不匹配,且现有的停车
本文介绍了基于NI(美国国家仪器)的CompactRIO控制器的五轴联动车载跟瞄系统的控制系统设计。首先介绍了整个系统的硬件组成,并详细介绍了控制系统的几个硬件核心部件。之后分模
随着现代科学技术的不断推进,以及“十三五”国家科技创新规划的部署,针对像可重构机械臂一类具有模块化、灵活性等特点,以及对外界环境与操作任务具有强大适应能力的智能机
随着科学技术的发展,镜片的加工技术得到了快速发展,免模加工自动磨边机在镜片加工中得到了广泛的应用。当前免模加工自动磨边机多采用接触式进行镜片轮廓的测量,由于探针需要接
采用轴带发电装置的混合电力推进系统具有工作模式灵活、油耗低、污染少、升级成本低等优点,已成为船舶电力推进系统一个新的发展方向。随着无位置传感器技术的深入研究,对恶
PID控制规律用于控制系统的时候,不仅结构简单,而且控制稳定可靠,并且调整方便,因此被广泛的应用于控制系统中。但是随着人类科技的发展以及认识程度的提高,目前需要控制的DC