论文部分内容阅读
语音通信是一种基础而有效的获取信息的方式,语音通信中的关键技术是语音信号的压缩编码,而一种好的编码模型无疑会对编码技术的发展起到指导作用。传统的语音编码使用波形编码或者参数编码方法,都存在着不足,或者编码速率较高,或者语音合成的自然度不好。MBE模型的优点在于合成语音有比较强的自然度,而LPC模型的优点在于它能够对声道模型做出恰当的模拟,论文从提高合成语音的自然度出发,结合了MBE模型和LPC模型优点,提出了LPMBE编码模型,目的在于保持MBE模型的优点同时增加它的压缩比。 LPMBE模型将语音的产生划分为两部分,即激励和声道,在频域详细分析了语音激励信号的各种性质,并且针对MBE模型提取基音周期的不足,设计了中心偏离函数的基音搜索方法(频域),该方法采用反向推理的方式,能够确切提取出语音激励信号的周期;同时,为了弥补频域内计算量较大的缺点,设计了修正的短时平均幅度差函数(MAMDF)在预测残差中进行基音周期粗搜索;LPMBE模型在不损失过渡音信息的前提下,减少了MBE中发生清浊音误判的概率,从而使得合成语音更加自然;基于DCT变换的最佳近似特性,论文研究了在LPMBE模型中如何减少所需要量化的残差谱幅度个数。考虑到在语音通讯中交互双方的说话是交替进行的,一方说话的时候,另一方在静止的听,因此在一次通话期间,每一方占用语音信道的50%或更少的资源,为此,论文研究了静音检测(VAD)的基本原理,并且给出了检测的实验值。 最后,论文就LPMBE模型在MATLAB中实现了仿真,并在MATLAB环境中设计了语音编码器质量评估界面,该界面与Windows平台相结合,建立起一个功能比较丰富的语音编码器质量评估平台,利用该平台LPMBE模型所合成的语音质量进行了评价,评价结果表明LPMBE模型达到了预期效果。