窄带通信中的低速率语音编码算法研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:juezhan2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类通信中最基本也是最重要的方式便是语音通信,但是在进行语音通信过程中,由于语音本身存在的冗余性,使得信息的传递与存储面临诸多问题。因此用来解决现代语音通信中存在的带宽、传输可靠性、抗噪声性之间矛盾的低速率甚至超低速率的语音压缩技术由于具有深刻的现实意义而成为研究的热点。将语音信号分为清音和浊音,分别选择不同的激励源来合成语音能够有效地模拟原始语音的周期性;根据语音信号的频率将其划分为若干子带,不同子带分别进行清浊音的划分,能够更精确地确定语音信号的清浊音信息;由正弦激励模型作为浊音的激励源,不仅描述了语音的周期特性也可以对语音信号的幅度特性进行描述,从而使得合成语音清晰可懂。由清华大学所提出的正弦激励线性预测(Sinusoidal Excitation Linear Prediction)算法兼具上述语音编码技术优势,使得其能在低编码速率的基础上很好的模拟自然语言,合成的语音质量较高。SELP算法由于上述特点成为最有潜力的算法之一而被广泛研究。本论文首先深入学习了SELP语音压缩算法采用的各项技术,详细讲解了SELP算法编码过程中每个参数的提取和量化的具体方法,以及解码中的语音合成过程。在此基础之上采用增加帧长、多帧联合帧内参数插值等技术设计实现了1.2Kb/s SELP算法,并在PC机上基于开源MELP代码,用C语言实现2.4Kb/s及1.2Kb/s SELP算法。将合成语音与原始语音在时域与频域进行比较,并用平均满意度(Mean Opinion Score)方法对合成质量进行评价,基本达到通信要求。
其他文献
随着信息科技的迅猛发展,计算机技术和网络技术的更新换代拓展了图像应用领域。人们对远程会议、电子商务、远程教育等技术的需求不断增加,相关技术也得到了快速的发展。人脸
聚类是一个重要的基于统计的无监督信息处理工具,在很多应用领域起着基础的作用。其中,文档聚类是对文本文档进行聚类的方法,对于信息检索有着减小数据规模、改善检索效果的
随着移动互联网的飞速发展,用户正不断的由传统的PC转向智能手机,并且,对手机应用的需求量也越来越大,因此,构建一个移动综合网络下载平台,为用户提供应用的下载和其他辅助服
近年来,随着旅游业的迅速发展,人们对旅游的需求日益呈现出多样化的趋势,旅游行业中的竞争也不断加剧,因此,旅游广告日益得到旅游业界的重视。旅行社、旅游产品、旅游景区要
随着国民经济的高速发展,我国现在已经迈入了以电力和电子为基础的现代化时代,微电子器件和信息技术应用也日渐普及,因此,近年来雷电灾害带来的经济损失越来越大,并且影响也
随着物联网技术的发展和智能终端的普及,面向物联网的终端应用也越来越多。当今,物联网与智能终端的结合是对互联网发展的极大促进。一方面,物联网的发展为智能终端应用提供了大