卷积神经网络在声纹识别中的应用研究

来源 :贵州大学 | 被引量 : 11次 | 上传用户:w56382955
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种典型的生物特征识别技术,声纹识别就是根据说话人的语音特征识别说话人的身份。声纹识别所提供的安全性可与其它生物识别技术(脸相、指纹、掌纹和虹膜识别技术)相媲美,且语音录取只需电话或麦克风即可,无需特殊的设备,数据采集极为方便且设备造价低廉,是最为经济、可靠、简便和安全的身份识别方式。在任何时候,只需输入说话人的语音,依靠说话人独特的声纹,其身份便可被安全地鉴别。因此,声纹识别成为国内外研究人员关注和研究的一个热点。由于声纹获取、处理等都拥有许多不稳定因素,如采集环境复杂、易被模仿、信道变化等,这些因素都会影响声纹系统的精度和可靠性,所以声纹识别中仍有很多技术问题急需解决。本文围绕声纹识别的系统结构,结合卷积神经网络的结构特点,提出不同解决思路。首先,针对声纹识别系统的不同环节,分析现有主要技术手段的优点以及不足。给出基于梅尔频率倒谱系数和高斯混合模型的经典声纹识别系统,通过实验验证不同参数对系统的影响。其次,在研究卷积神经网络的结构并重点分析其卷积操作和降采样操作的基础上,将这两种操作组合起来,提取出对平移、旋转、尺度变化具有不变性的初始特征。进一步,提出两种基于卷积神经网络的声纹识别预处理方法,即一维卷积预处理和二维卷积预处理方法,并通过实验验证了该方法相比经典方法具有更好的效果。最后,重点研究声纹识别的特征提取和模式匹配过程,提出将这两个独立过程统一到卷积神经网络的结构中来。通过计算语音信号的语谱图,将其作为网络的输入,网络输出为说话人的类别。该方法充分利用卷积神经网络的优势,解决了声纹识别中特征参数选择困难以及模型训练难等问题,并通过实验验证了该方法的有效性。
其他文献
力拓Iron & Titanium公司最近开展一项铸造研究项目,目的是更好地了解在低温下满足高冲击功要求的铸态大断面球铁件的制造.试验铸件尺寸为180 mm×180 mm×190 tnm,铸态夏比
近年来,伴随着世界范围内船舶产业的空前繁荣,我国也紧跟世界步伐,在船舶建造领域有了巨大的突破,并跃居成为世界三大造船基地之一,使得我国的船舶无论是从数量、种类,还是设
无线多跳网路作为无线数据传输的通信基础,用于实现发送端到接收端之间的多跳数据的传输与处理。无线多跳网络易搭建且自身硬件成本低的特点,使它被广泛地应用于军事、医疗等
无线传感器网络(简称WSN)是由大量具有特定功能的传感器节点通过自组织的无线通讯方式,相互传递信息,协同地完成特定功能的智能专用网络,它综合了传感器技术、嵌入式计算技术
随着生活节奏的日益加快,人们更加迫切希望可以方便、快速的与计算机直接地进行交流。语音作为一种最理想的人机交互方式,使之成为该领域的研究重点。语音识别技术承载着这一
作为通信系统中的重要组成部分,同步技术保证通信系统的性能,一直是通信系统中的热点研究问题。由于载荷受限,在卫星通信中如何在低复杂度条件下完成基带信号处理是难点之一
随着无线通信业务的发展,通信系统对传输速率、传输时延的要求越来越高。跨层设计可以改进传统网络协议,提高系统性能,是近年来学者的研究热点。将跨层设计与LTE-A系统结合,
LTE的正式名称是Long Term Evolution,即3GPP长期演进项目,是近两年来3GPP启动的最大的新技术研发项目。它改进并增强了3G的空中接入技术,采用OFDM和MIMO作为其无线网络演进
直角电桥在电学计量领域有着重要的应用,主要用于实现非同类阻抗的比较测量,直角电桥的具体结构有很多种,但是无论结构怎样,一对幅值相等、相位相差90度的直角电压源是必需的部件。直接数字式频率合成器(DDS),与传统频率合成器相比,可以方便的对相位进行调节,并且其具有较高的频率分辨率、可以实现快速的频率切换,并且在频率改变时能够保持相位的连续,很容易实现频率、相位和幅度的数控调制。DDS的这些特性使得其
认知无线电是指具有自主寻找和使用空闲频谱资源能力的智能无线电技术。认知无线电技术的提出,为解决不断增长的无线通信应用需求与日益紧张的无线频谱资源之间的矛盾提供了