论文部分内容阅读
时代的发展进步促进了通信方式向多样化和高质量发展。传统的窄带电话信号有时会限制语音的完整表达,为此人们引入了宽带语音编码,其扩展的低频部分可以使语音听起来更自然、让听者觉得更舒适,高频部分可以提高语音的被理解程度,方便辨别说话者,实现“听音识人”。但是宽带语音的承载系统较为复杂,相应地增加了应用的难度。在影响宽带语音编码算法复杂度的诸多因素中,固定码本搜索运算量占有相当大的比例,因此,我们有必要研究和改进固定码本的搜索方法,从而降低宽带语音编码算法的整体复杂度。本文介绍了宽带语音编码的基础知识,了解了常用的编码器模型,然后以宽带语音编码G.722.2作为研究对象展开工作,在研究其固定码本结构及其搜索过程的基础上,结合脉冲取代、码失分段等固定码本搜索方法,提出以下的固定码本搜索改进方法:首先提出了深度树脉冲取代法(FTPR, First Tree Pulse Replacement Method),它利用了脉冲取代法编解码语音质量好的特点和深度优先树搜索速度快的特点。实验结果表明,虽然编码质量比深度优先树搜索略有下降,但算法复杂度和整体编码运行时间都有大幅度减少。其次改进了码矢量分段搜索方法(IFCDS, Inproved Fixed Codebook Subsection Search Method),利用参考信号确定初始码本,并采用交叉方式进行矢量分段。实验结果表明,改进后的运行时间更短,但是该方法语音质量下降得相对较多,且男女声实验结果有较大悬殊,需要进一步改进。最后提出了代数码本分级分段替代方法(SPCR, Sub-position Sub-codevector Replacement Method),将基本分级替换的思想应用到固定码本矢量分段搜索方法中,用于子码失的更新,从而达到保证质量并降低时间的目的。实验结果表明,该方法较前两种方法改进效果最好,其合成语音质量与深度树脉冲取代法的合成语音质量相当,但编码时间却比深度树脉冲取代法运行时间短很多。