【摘 要】
:
本文研究的内容是基于人耳听觉特性的语音特征提取方法,主要分为三个部分:听觉掩蔽特性、等响特性以及耳蜗分频特性。以下是本文的主要贡献: 1) 提出了一个以mel频标划分b
论文部分内容阅读
本文研究的内容是基于人耳听觉特性的语音特征提取方法,主要分为三个部分:听觉掩蔽特性、等响特性以及耳蜗分频特性。以下是本文的主要贡献: 1) 提出了一个以mel频标划分bark频带的方法,得到了一个barkmel表。在基于听觉掩蔽的研究中,介绍了掩蔽的概念以及传统的利用掩蔽特性进行语音识别的方法。传统方法还包括对含噪语音进行谱减法去除含噪语音中的平稳噪声。本文详细研究了mel频标和bark频带的关系,得到了一个barkmel表,在对此表的实验中,还对提取的MFCC系数做倒谱提升,MFCC系数和一帧能量帧进行一阶、二阶差分,得到39维特征参数,使得掩蔽特性在MFCC参数提取中达到最优化。 2) 提出将信噪比和等响特性联合加权和根据新的ISO标准设计了一个新的等响加权滤波器。在基于人耳等响特性的研究中,发现普通的等响加权将语音信号按频谱分段,各个段分别加权,如果某一语音段信噪比比较低,那么此方法无疑会扩大噪声对信号的影响,不利于识别率的提高。本文提出当信号通过等响滤波器之后,利用信噪比对加权之后的频段再次加权。另外,本文还根据ISO226:2003的等响曲线标准,设计出了一个新的等响加权滤波器。 3) 提出在子带中使用等响加权。在基于耳蜗分频特征的子带技术研究中,本文先分析了子带分频技术在噪声条件下比普通方法较好的理论依据,然后研究提出在子带中加入等响特性,可以提高识别率这一方法。本文还研究了在其他文献中所提到的信噪比加权和特征、HMM模型同时加权的方法,使特征空间和模型空间更加匹配。特别在信噪比加权法的介绍中,本文提出使用信噪比平滑技术,这样可以使求得的信噪比值更加准确。
其他文献
产品结构管理技术的发展融合于产品数据管理技术(product data management)的发展之中,产品数据管理技术出现于20世纪80年代初期,从开始的工程图档管理逐渐扩展,迅速成为一门
电力负荷管理系统是运用通信技术、计算机技术、自动控制技术对电力负荷进行监控、管理的综合管理信息系统。随着电力负荷管理系统应用的不断深入,负荷管理具有图形系统、数据
Client/Server结构是近几年非常流行的一种分布式计算模式,它的优势在于广泛地采用了网络技术,将系统中的各部分任务分配给网络中担任不同角色的计算机。然而在分布式环境下,
近年来对网络业务流量的测量和分析表明,网络业务是自相似(分形)的。网络业务的自相似特性对网络的分析、设计、控制和性能评价等均具有重大的影响。本文介绍了自相似的常见
随着计算机网络技术和多媒体技术的发展,流媒体正成为互联网应用的主体,推动了互联网整体架构的革新,拉动信息经济的发展,在互联网媒体传播方面起到了主导的作用。各种多媒体应用
随着网络以及多媒体技术的迅速发展,涌现出了大量的数字视频,如新闻、广告、娱乐节目、个人自制视频等。在快节奏的现代社会里,数字视频的大量涌现引发了一个重要的问题,即如何快
决策树是建立在信息论基础之上,对数据进行分类挖掘的一种方法。其基本思想是,通过一批已知的训练数据建立一棵决策树,然后利用建好的决策树,对数据进行预测。决策树的建立过
近年来随着疲劳驾驶导致越来越多的交通事故发生,驾驶疲劳监测已经成为辅助安全驾驶领域的一个重大课题。以往的驾驶疲劳监测研究中,常常通过司机的面部视频信号和脑电、体温等
随着网络技术和多媒体技术的迅速发展,网络音频视频也成为必不可少的内容。于是,流媒体技术应运而生,不仅应用在PC机上,而且也广泛的应用在一些嵌入式设备上。流媒体具有实时
分类问题尤其是多类分类问题一直是数据挖掘研究的热点问题。在实际应用中,如图像识别,文本分类等等,需要处理的数据都是海量和多类别的。如何解决多类别的分类问题,是近几年研究