论文部分内容阅读
语音作为语言的声学表现形式,是人类彼此之间进行信息交流时使用的基本载体和重要手段。在语音信号处理中,最基础的是能否准确的提取语音信号参数。因为只有获得准确的、可表征语音信号本质特征的参数,才有可能运用这些参数进行高效可靠的语音识别、语音编码以及语音压缩编解码等处理。其中,语音信号的清/浊音判决和基音周期的提取就显得尤为重要,其判决和提取的准确与否会直接影响到语音合成是否真实,是否能够再现原始语音信号的频谱。随着现代信息科学技术的迅猛发展,特别是计算机网络技术的日益完善和普及,使得语音信号处理技术在当代发挥着越来越重要的作用。当前,语音信号处理技术及其应用技术已经成为信息社会中不可缺少的重要组成部分,对日后促进社会的发展具有深刻意义。清/浊音判决是语音信号处理中最基本的问题之一。目前,关于语音信号清/浊音的判决算法有很多种,基于定量递归分析的清/浊音判决、基于相空间重构的非线性语音清/浊音判决、以及清/浊音判决在声码器中的算法优化等,这些算法在不同应用领域范围内都有显著的效果。而且在所有算法中,清/浊音判决都要借助于门限,参数的选择也会影响到判决的效果。针对这些算法的问题,本文提出了一种新的判决清/浊音的检测方法。该方法主要对语音短时特征进行统计分析并估计其概率密度函数,通过对语音信号的先验概率的估计和类条件概率密度的估计,再利用Bayes公式得出后验概率,然后进行清/浊音判决。利用上述结论再对语音信号进行基音检测以及共振峰估计。在此基础上又研究了基于线性预测(LPC)的基音检测方法,利用对短时特征统计分析的新方法,进行基于线性预测的基音检测。经过系统检测结果可以看出,这两种方法都可以实现对基音的检测及共振峰估计,具有一定的效果和可行性。