基于波形内插技术的低码率语音编码的研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:pgglankejianxin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音编码的目的是在保持一定的算法复杂程度和通信时延的前提下,占用尽可能少的通信容量,传送尽可能高质量的语音。多媒体通信的发展,使得宽带十分宝贵,因而需要高质量的低码率语音编码。在低码率语音编码领域,波形内插(WI)语音编码作为混合编码的一员,算法性能优良,被称作是最具潜力的编码算法之一。   本文以特征波形内插(Characteristic Waveform Interpolation,CWI)模型为依托,对该编码方法中的关键技术诸如特征波形分解、相关参数的量化等进行了研究,最终提出了一种基于双正交提升小波变换分解的1.7Kbps特征波形内插(BLWT-CWI)语音编码算法。   本文的主要工作和创新如下:   一、针对特征波形CW维数过高的问题,提出了一种对CW进行分类的算法,以提高分解精度和量化效果,降低计算复杂度和空间消耗度。该方法是根据该帧特征波形的8个子帧中最大基音周期的长度来划分的,将CW分成四类。基于此,本文对CW的量化,也采用上述分类的方法,即对每一种类型设计出一个相应的码书,并进行相应的量化   二、为了进一步压缩帧间冗余的信息,提高量化效率,降低编码速率,本文采用两帧联合矢量量化方法来量化LSF、基音周期和功率。根据LSF参数的帧内和帧间相关性,提出了两帧联合预测多级分裂矢量量化方法。该算法是用当前超帧和上一超帧中第二帧的LSF频率来预测当前超帧的LSF参数,预测后,对预测残差矢量采用多级分裂矢量量化方法。并将此量化方案与预测式瞬时联合多级分裂矢量量化方案进行了比较。   三、本文构建了1.7Kbps的BLWT-WI语音编码器。MOS分测试结果表明,1.7KbpsBLWT-CWI和2.32KbpsBLWT-CWI两种编码算法的语音编码质量非常相似,后者略优于前者;主观A/B测试结果表明,对于所有语音而言1.7K.bpsBLWT-CWI语音编码算法的重建语音质量与2.4KbpsMELP编码算法基本一致。而从语音信号重建波形的比较中发现此编码算法对男声信号编码重建的质量比对女声信号要好。
其他文献
合成孔径雷达(SAR)自诞生以来,由于其全天候和全天时工作能力以及高分辨率特点,使其在军事和民用两个方面均得到了广泛的应用。   然而由于SAR系统的相干成像特点使得所生成
随着蜂窝移动通信系统的蓬勃发展,频谱资源日益紧缺,而用户对数据传输的要求却越来越高,如何优化现有频谱资源,使有限的频谱资源得到有效利用是当前研究的热点。OFDM技术是新
pH值是衡量溶液酸碱度的一个指标,是环境中影响物理、化学和生物反应的关键因素,pH值的检测在气象、环保、养殖业和种植业等都具有重要的意义。传统测量pH值的工具是pH计、pH
随着现代无线传输技术和视频压缩技术的发展,使得高速无线视频传输在各领域得到广泛的应用。本文主要研究穿戴式网络无线视频传输应用中的视频采集和压缩技术。本文共分为以下
移动机器人对于环境信息的准确识别是其实现自主导航和智能控制的基础,本文主要以移动机器人的障碍物环境模式识别作为研究重点。通过对障碍物模式识别算法的研究,本文提出一
三维重建技术的研究是计算机视觉学科的一个重要领域,而双目视觉则是三维重建中的一项重要技术,它利用左右摄像机拍摄出的立体图像对,依据其中包含的几何关系将场景的三维信息重
多模态优化是近些年兴起的一门新学科,目前在科研和工程实践的应用需求日显突出。对航空航天、网络通信、生命科学等诸多实际问题进行数学建模后,都可以将其抽象为一个数值函
无线传感器网络是由大量具有感知、数据处理和通信能力的微型传感器,通过自组织形式构成的网络。通过节点间的分工协作,无线传感器网络可以实时监测、感知和传输网络分布区域
【摘要】 大学网络文化的兴起与发展对师生尤其是大学生的思维方式、价值观念、精神世界正以其神奇的力量加速改变着。特别随着媒介传播方式的改变,信息方式的转变,给传统的校园主流文化受到严重的冲击与挑战。 本文从网络新媒体的视角来谈校园网络文化的建设与思考,从网络舆论、舆情研判等角度,分析了校园网络文化如何定位、如何发展的问题。  【关键词】 大学网络文化建设 探索与思考  一、穿针引线:注重网络舆论宣传
为了解决由无线通信需求的增长而导致的无线通信资源日益紧张的问题,具有高效无线通信资源利用率的新型无线通信技术成为研究的热点。由于自适应的参数调节能力以及高效的频