【摘 要】
:
声纹识别(Voiceprint Recognition)也叫做说话人识别,其主要任务是通过人的语音中提取的特征来识别或确定未知用户的身份。声纹识别所提供的安全性可与指纹识别、掌纹识别、虹膜
论文部分内容阅读
声纹识别(Voiceprint Recognition)也叫做说话人识别,其主要任务是通过人的语音中提取的特征来识别或确定未知用户的身份。声纹识别所提供的安全性可与指纹识别、掌纹识别、虹膜识别等技术相媲美,在取样过程中仅需要麦克风和声音即可,数据采集方便,造价低廉,是一种经济、可靠、便捷、安全的身份鉴别方式。 目前声纹识别技术已经开始应用于各种智能设备,如:使用声纹实现登录设备,说话者确认用作金融交易的安全措施,智能家居中的语音助手等等。本文研究了声纹识别的发展历程和研究现状,改进现有声纹识别的端点检测和语音增强环节,最终构建深度神经网络(DNN)模型,并在自建的声纹语音库上实现声纹识别。具体研究内容和创新点如下: (1)端点检测技术是语音信号前端处理的重要环节,良好的端点检测技术不但能够将语音信号分割为语音段和无声段,同时能够去除无声段对后续工作的影响,减少数据量。本文针对传统双门限法门限宽泛、抗噪性差等缺点,提出一种使用能熵比和幅度压缩滤波(PEFAC)相结合的端点检测技术。在能熵比进行一级端点粗判之后,使用PEFAC的语音概率进行语音信号二级精确判定。最后将提出的新方法与传统的双门限法和能熵比方法在不同噪声背景下进行对比实验。实验表明,本文提出的方法在低信噪比下能够较准确的确定语音帧的位置,端点检测准确率更高。 (2)噪声干扰一直是影响语音识别和声纹识别准确率的重要因素,如何在不干扰语音特征的情况下对语音信号进行降噪也是研究的热点。本文针对压缩感知语音增强算法中观测矩阵具有随机性,观测结果差距大的问题,利用混沌序列具有随机性与确定性统一的优势,提出使用二值化后的混沌序列作为观测矩阵,在稀疏度未知的情况下进行压缩感知语音增强,并与传统的压缩感知语音增强结果进行对比实验,结果表明,本文的算法,针对语音增强效果更为明显。 (3)声纹识别模型一直是研究的热点和难点,本文针对目前比较热门的神经网络进行了研究,最终搭建了深度神经网络(DNN)声纹识别模型。将声纹信号输入到搭建的DNN模型,并比较隐藏层层数对识别率的影响,最后与传统模型进行对比实验,结果表明,使用本文搭建的DNN模型进行声纹识别,准确率更高。
其他文献
钢铁工业在我国基础工业中占据了举足轻重的作用,钢铁的质量直接影响着我国的经济发展。在钢条的生产过程中,温度分布和冷却速率对于钢铁的微观结构有着非常重要的影响,从而
非接触式感应耦合电能传输(Inductively Coupled Power Transfer,ICPT)技术,是一种新型的电能传输技术,它通过高频磁场搭建供电设备与用电设备之间的能量传输通道,实现了非接触方式传输能量,以其高可靠性、高安全性、低维护性等优点得到了迅速的发展。由于LCL复合谐振型ICPT系统比传统的单级LC谐振型ICPT系统有更大的谐振容量,在传输同等大功率等级下,这种系统的开关管
随着互联网、移动通讯、无线网络、个人多媒体业务以及工业网络中大量多媒体数据的出现,对路由器的队列调度和队列管理能力的要求越来越高。路由器在转发传统数据包业务的同时
现实世界的很多问题都是多目标优化问题。在多目标问题中,各目标之间通常不是独立存在的,往往互相冲突,因而,不存在单一解向量使得所有目标最优,这使得多目标问题难于优化。
随着信息技术的发展和工业过程自动化水平的不断提高,多相流在工业过程中出现的频率越来越高,从而在科学研究和工业过程中对多相流参数的实时检测提出了更高的要求,对多相流
视觉里程计(Visual odometry,VO)是一个利用与运动物体相关联的单目、立体或者三维相机获取图片信息,进而通过计算图片间的关联关系来估计物体运动情况的装置,可为视觉导航定
新闻节目作为人们获取信息的一种方式,在人们日常生活中起着非常重要的作用。基于新闻视频的字幕检测与提取是基于内容的视频信息分类检索的一部分,是多媒体信息处理研究领域中
随着森林在环境中的作用日益显著,人们开始对森林环境进入更深入的研究,相关研究已由基本的森林资源对大气环流的影响领域扩展到如何保护森林资源,从而让森林发挥应有的作用,
近年来,对于具有多变量、非线性、变量间有多重相关性特点的复杂系统的建模,采用较多的是利用神经网络、模糊逻辑等智能方法建立单一模型。然而,对辅助变量采用单一的函数关
随着现代科技的发展,交流伺服技术的应用领域更为广泛,所发挥的作用越来越突出,对其性能指标的要求也越来越高。交流伺服系统是一个具有非线性、耦合性和时变性的复杂系统,常规的控制策略难以取得理想的控制效果,本文针对交流伺服系统高品质的控制要求以及其存在的摩擦非线性、系统参数变化、负载扰动等问题,研究了一种RBF神经网络与PID控制相结合的复合控制策略。本文首先建立了包括摩擦非线性在内的交流伺服系统动力学