语音短时特性的统计分析

来源 :青海师范大学 | 被引量 : 0次 | 上传用户:yuhaolf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号分析是进行语音信号处理的基础,只有分析出能够准确表示语音信号本质特征的参数,才有可能通过这些参数实现诸如语音通信、语音合成、语音识别等的处理。而且,语音信号分析的精准程度也决定着语音识别率的高低和语音合成的音质好坏,所以说,语音信号分析在整个语音信号处理及应用当中都具有举足轻重的地位。语音信号在整体上虽然具有时变特性,但是在很短的时间区域内是相对稳定的,即其特性保持基本不变,这个很短的时间一般认为是在10ms到30ms之间。因而,在短时间内可以把语音信号看作是一个平稳过程,也就是语音信号具有短时的平稳性。所以对语音信号的任何处理和分析都必须建立在一个短时的基础上,即所谓的“短时分析”。文中对语音信号的统计分析正是建立在“短时分析”基础上。语音信号的清浊音判决是语音信号处理过程当中的一个十分重要环节,而传统的判决方法是选择一个短时特征值,并且设定该特征值的一个门限。这种方法虽然简单易行,但事实上清/浊音之间并没有明确的分界,设定门限即是对清浊音进行强制分界,这会极大增加清/浊音在重叠区域的误判。为了回避传统方法的这种弊端,提出了一种基于短时统计分析的清/浊音判决方法。该方法以短时统计分析为基础,先对清/浊音短时能量分布的先验概率及其概率密度函数进行估计,然后借助贝叶斯判决模型进行清/浊音判决。先验概率的估计是利用清/浊音的单一特征门限,将大量语音帧分为清/浊音帧,然后统计先验概率;概率密度函数估计是利用有监督参数估计法,先绘出清/浊音分布直方图,从直方图上判断概率密度函数的类型,然后用大量语音样本估计其参数,从而得到概率密度函数。通过仿真实验证明,新方法比传统方法具有更好的判决效果。
其他文献
指纹识别是因为其悠久的历史以及较高的识别精确度,成为了目前最成熟的生物特征识别技术之一,并被广泛的应用到各个领域当中。然而直到目前为止,非理想条件下指纹识别中仍存在一
本文对基于Internet协作学习系统的设计与实现进行了研究。主要包括以下四个方面的内容: 第一,提出了系统的总体框架的,包括系统中用户角色的设计、用户活动空间的设计等。
生物特征识别技术是一项利用人类特有的生理或行为特征来进行身份识别的技术,它提供了一种可靠、稳定性高的身份鉴别途径。时—频分析工具和线性判别方法是人们关注的两个生
人才评价平台是根据当前人才测评需要和实际测评流程而开发的,为各种专业人才评价业务提供统一管理的系统平台。通过对人才评价业务中信息和过程的管理,实现系统整合和资源、知
电容层析成像技术ECT(Electrical Capacitance Tomography)是近年来获得了快速发展的一种多相流在线检测成像技术,它具有成本低、适用范围广、采集速度快、非侵入式、操作方便和
随着互联网的普及和电子商务的发展,电子商务系统在为用户提供越来越多选择的同时,其结构也变得更加复杂,用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。电
工作流管理联盟(WFMC)早在1995年就提出了工作流参考模型和一系列的接口规范,在近几年的发展中,工作流的理论日趋成熟.随着面向对象技术和分布式计算的发展,特别是Java技术以
动词次范畴化信息反映了动词作谓词时所表现出来的不同句法特征的分布,作为自然语言处理进一步发展所不可或缺的知识,汉语中的相关研究还很薄弱。探索面向真实语料的汉语动词
隔行扫描技术自电视技术诞生以来得到广泛应用,很多珍贵视频资料都是隔行扫描格式的,所以在相当长的时间内,它仍然会作为主要视频格式之一活跃在历史舞台上。图像级帧场自适
随着互联网的不断发展,电子商务迅速崛起。从早期的电子数据交换EDI到基于Internet的电子商务,从静态的Web方式到动态的人机交互,从B2B,B2C到C2C。电子商务呈现出一种前所未