基于NPC和改进的MFCC鲁棒语音特征提取研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:binghemiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别在实验室环境中已取得了令人满意的效果,但当运用到实际环境时却往往出现识别率显著下降的情况,如何提高噪声环境下的语音识别鲁棒性是当今语音识别研究中最为重要的问题。本文针对语音识别前端处理中的鲁棒性语音特征提取技术展开研究,分别从时域和频域两个方面出发,并结合人类发声特点和人耳听觉特性对已有的特征进行改进,提出了两种具有较好鲁棒性的语音特征提取方法。首先,本文提出采用神经网络进行非线性预测的时域特征提取方法,针对神经网络预测存在大量待估计参数的问题,通过线性预测方法中的最小均方误差原理,减少了估计参数的数目,实现了鲁棒性较高的特征提取。实验表明,在多种信噪比下,与线性预测编码系数(Linear Predictive Coding, LPC)和梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients, MFCC)特征相比有更好的鲁棒性。其次,针对传统MFCC的离散余弦变换(Discrete Cosine Transform,DCT)在语音信息表达方面存在的缺陷,采用具有更好表征能力的独立成分分析法(Independent Component Analysis,ICA)对离散余弦变换进行替换,提出了一种新的特征提取方法。实验表明,新的提取方法显著增强了改进后特征对语音特性的表达能力,在相同信噪比下比传统MFCC特征具有更好的鲁棒性;同时,为减少识别中出现的插入错误,引入了Hermansky提出的相对谱滤波技术,实验结果表明,与传统MFCC及ICA改进的MFCC相比,结合相对谱滤波技术的新方法显著减少了插入错误,且保持较高的词识别率;与传统感知线性预测(PerceptualLinear Predictive,PLP)及相对谱滤波改进的PLP相比,词识别率提升很多且去除插入错误的词识别率相差很小。
其他文献
随着我高速铁路信息化的发展,有关高速铁路的数据分析在保证高铁安全舒适的运营和整个国民经济的持续发展中将会起到更加重要的作用。然而,由于环境等复杂因素,采集得到的动
调剂是研究生招生的重要环节,能否做好调剂工作不但关系到考生的利益,而且关系到招生单位招生的成功与否。由于考生和招生单位各自特点的复杂性、多样性,所以做好调剂工作是
桌面程序作为日常生活中最常使用的软件类型,随着规模的扩大和功能的增加,其测试工作也变得越来越庞大和繁琐。为了有效提高桌面软件开发过程中的测试效率、缩短开发周期、降
近年来,传感器技术、微系统技术、无线通信等技术的进步共同推动了具有低能耗、多功能传感器网络的产生和发展。无线传感器网络是利用大量廉价的传感器组成的一个具有数据感
作为汽车产销量的大国之一,我国汽车行业的竞争已经达到了白热化的状态,“马太效应”日益凸显。众多汽车行业的中小型企业由于自身物资以及行业信息的匮乏,在这场竞争中艰难
摘要:随着软件技术的飞速发展,软件的质量一直是软件行业关注的主题。软件测试作为保证软件质量的重要手段,在软件开发过程中发挥着至关重要的作用。软件测试在软件开发过程中
无线传感网络是以数据为中心的网络,如何实现感知数据的有效收集是实现传感网络广泛应用的关键技术之一。随着移动传感网络的发展应用,若继续采用传统数据收集模式,则数据传
随着机器人技术发展和成熟,机器人的的应用和需求也与日俱增。白定位与地图构建是实现机器人自主导航的关键问题,集中体现了移动机器人的感知能力和智力水平。与单移动机器人
数字信号处理器(Digital Signal Processor, DSP)往往具有不同于通用处理器的体系结构,传统编译技术生成的代码无法满足信号处理的高性能要求。这需要我们采用与传统不同的编
随着计算机网络技术的迅速发展,企业在信息化建设过程中,需要有很多的信息管理系统来维护企业数据。由于企业间以及企业内部各部门间的相对独立性,造成了构建系统数据的分布