论文部分内容阅读
语音信号分析是进行语音信号处理的基础,只有分析出能够准确表示语音信号本质特征的参数,才有可能通过这些参数实现诸如语音通信、语音合成、语音识别等的处理。而且,语音信号分析的精准程度也决定着语音识别率的高低和语音合成的音质好坏,所以说,语音信号分析在整个语音信号处理及应用当中都具有举足轻重的地位。语音信号在整体上虽然具有时变特性,但是在很短的时间区域内是相对稳定的,即其特性保持基本不变,这个很短的时间一般认为是在10ms到30ms之间。因而,在短时间内可以把语音信号看作是一个平稳过程,也就是语音信号具有短时的平稳性。所以对语音信号的任何处理和分析都必须建立在一个短时的基础上,即所谓的“短时分析”。文中对语音信号的统计分析正是建立在“短时分析”基础上。语音信号的清浊音判决是语音信号处理过程当中的一个十分重要环节,而传统的判决方法是选择一个短时特征值,并且设定该特征值的一个门限。这种方法虽然简单易行,但事实上清/浊音之间并没有明确的分界,设定门限即是对清浊音进行强制分界,这会极大增加清/浊音在重叠区域的误判。为了回避传统方法的这种弊端,提出了一种基于短时统计分析的清/浊音判决方法。该方法以短时统计分析为基础,先对清/浊音短时能量分布的先验概率及其概率密度函数进行估计,然后借助贝叶斯判决模型进行清/浊音判决。先验概率的估计是利用清/浊音的单一特征门限,将大量语音帧分为清/浊音帧,然后统计先验概率;概率密度函数估计是利用有监督参数估计法,先绘出清/浊音分布直方图,从直方图上判断概率密度函数的类型,然后用大量语音样本估计其参数,从而得到概率密度函数。通过仿真实验证明,新方法比传统方法具有更好的判决效果。