基于DSP的混合激励线性预测语音编码算法及其实现

被引量 : 0次 | 上传用户:liuligen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
引言在移动通信、卫星通信、军用通信系统中,语音编码技术在压缩语音信号的传输带宽、降低信道传输码率,进而提高信道利用率发挥着重要作用。近年来,语音编码技术取得了突飞猛进的发展,研究的焦点也随着信号处理和通信技术的发展集中在低码率和甚低码率编码算法的研究与实现上。传统的LPC声码器采用简单的二元激励模型,不能更好地模拟实际语音的特征,致使合成语音的质量以及鲁棒性较差;码激励线性预测(CELP)低速语音编码算法根据感知加权误差最小准则,从自适应码本以及固定码本中搜索最佳码矢量作为激励。它能在8~16kbps的速率上合成出质量较高的语音。当编码速率进一步降低时,由于没有足够的比特数来表示激励矢量,致使合成语音质量下降很快。近年来,国内外在开展4kb/s及其以下速率的语音编码研究方面,主要代表算法有AMBE、MELP、WI、STC等。这些算法都大大降低了传输码率而节省带宽。在目前的低码率语音编码研究中,混合激励线性预测编码(MELP)是一种比较好的方法,2.4kbps的MELP编码方法已经被确定为美国新的联邦语音编码标准。该算法结合了LPC、MBE算法的优点,能在较低的码率下得到好的再生语音。本文在对FTR 1024A 2.4Kbps MELP算法分析的基础上,对其核心算法进行了细致的研究和大量的实验,对基音周期检测、LSF系数的传递、矢量量化、语音合成等环节加以改进,提出了一种码率为1.8kbps左右的改进MELP低速语音编码算法。 一、改进的MELP低速语音编码算法1.MELP模型的建立标准的MELP算法是基于传统LPC声码器的基础上,附加了五个特征参数,即:⑴混合激励,⑵非周期脉冲,⑶自适应谱增强,⑷脉冲散布,⑸付氏幅度模型。这些附加特征的引入很大程度上改善了原有LPC参数模型的激励源构造,也消除了LPC合成语音中有时出现的机械的或蜂鸣的音调噪<WP=69>声,允许MELP编码算法能够模拟自然语音的更多特征,从而使得MELP声码器在低比特率上能够产生高质量的语音,成为目前低速率语音编码中最有潜力的方法之一。与LPC10的简单清/浊音判决不同,MELP采用混合激励源:通过一组带通滤波器将语音信号分成五个子频带,对每个频带进行清浊音判别,在合成端将这五个子带信号相加得到混合激励,其主要功能是减少LPC声码器的蜂鸣声。当输入信号是浊音时,MELP编码器能用周期或者非周期脉冲来合成语音。非周期脉冲大多用在清/浊或浊/清转换的语音段中。其结果能够使解码端重生不定期的声门脉冲而不引入其它声调。自适应谱增强滤波器是一个零/极点滤波器,目的是为了使合成语音与自然语音在共振区有更好的波形匹配。脉冲散布利用一个固定的脉冲整形滤波器对合成语音进行后处理。它能让激励信号的能量散布于整个基音周期之内。这使合成语音在非共振区与原始语音有更好的波形匹配,有助于消除合成语音中的一些刺耳噪声。在编码部分,我们对LPC逆滤波得到的残差信号进行傅立叶变换,取其前10次谐波值,量化后传到解码端,用以合成周期脉冲,这样有助于提高合成语音的自然度,尤其在有男声和背景噪声时。2.语音分析输入的语音信号首先经过预处理,通过截止频率为60Hz的高通滤波器,目的是为了抑制50H电源干扰。然后利用本文提出的归一化基音检测算法提取基音周期。该算法用到了前一帧和后一帧的信号,以及长时平均基音周期,保证了相邻帧基音周期的连续性。采用线性内插进行分数基音的搜索,提高了基音周期估计精度。经典算法有时检测到的是实际基音周期的倍数,该算法采用倍数检测消除了估计的误差。大量的实验结果表明,该算法不仅具有基音平滑算法的准确性、可靠性,而且能在当前帧内实时地提取基音周期估计值。MELP编码是一种基于LPC的参数编码方法,与所有传统的基于LPC<WP=70>合成-分析方法相同,其参数是逐帧分析和传送的,这种做法的不足之处是考虑语音的形成过程中,声道响应特征变化较缓慢的特点,即相邻帧之间的相似性,本文归一化自相关函数来表示相邻帧LPC系数的相似性,当相似度大于某个阈值时,就可以不传送当前帧的LPC系数,而以前面帧的LPC系数来代替。实验表明,采用该方法,约有50%左右的语音帧的LPC系数可以采用替代的办法,从而可以大大减小编码的码率,而且不会对再生语音的质量带来多少影响。接下来分析确定子带清/浊音强度及非周期脉冲标志,用德宾算法推出LPC系数,计算残差信号的峰值更新子带清/浊音强度,接着计算增益并更新平均基音周期。将输入信号通过量化后的预测系数构成的线性预测滤波器,求得残差信号,求出残差信号的前十个基音周期谐波处的付氏幅度值。3.参数编解码 经过语音分析,得到本算法的语音参数。在编码方案中的比特分配如表4-1。基音周期取对数后,用99阶的均匀量化器进行量化,这些数据采用查表的方法映射到7比特的码字上。用8比特对增益量化编码,其中采用5位的均匀量化器进行量化,然后,用3比特对进行量化编码。用4比特对子带清/浊音强度(Bpvc)量化编码。标准的MELP算法采用四级矢量量化,搜索路径为8,考虑到标准的MELP算法中,采用的码本容量太大,同时量化的码本矢量的第四级的补偿还比较大,本?
其他文献
自2010年以来,随着服装企业大量使用雪纺面料,使得涤纶仿真丝面料在寒冷的纺织大环境中反而产销两旺。但进入2012年5月份以来,由于生产企业产能的过快增长以及传统淡季的到来
设计一种针对基于FFT的PN码捕获自适应门限技术,对高斯环境下信号统计特性进行了推导,得出了适用于恒虚警概率自适应门限算法的统计量,并用最大似然准则对统计量进行参数估计
<正>国家钨材料工程技术研究中心(以下简称"中心"),是2007年4月经国家科技部批准组建,是我国钨材料领域唯一的国家级工程技术研发与产业化转化平台。目前,中心设有2个基础研
期刊
在分析大牛地气田碳酸盐岩储层地质特征的基础上,针对储层改造现状和改造难点提出了转向酸酸压技术,从理论和实验方面分析了转向酸体系的转向机理;通过流变性能、酸岩反应动力学
目的观察温胆汤合三子养亲汤加减治疗痰湿蕴肺咳嗽的临床疗效。方法采用随机对照的研究方法,将痰湿蕴肺咳嗽患者93例随机分为治疗组(47例)和对照组(46例),治疗组采用温胆汤合三子养
对合肥盆地中部肥西县打子塘地区圆筒山组砂岩(J2y)的磷灰石裂变径迹(AFT)分析表明,其FT年龄为(32.5&#177;2.4)Ma(22个颗粒的平均),明显小于其地层的年龄(176~168 Ma);围限径迹长度为(12.
主要分析了电力系统谐波产生的原因及危害,归纳总结了目前电力系统中进行谐波抑制常用的方法,介绍了各种解决谐波污染的手段及所使用的设备。
10月28日,由上海宋庆龄基金会—东亚银行公益基金(下称“东亚银行公益基金”)捐建的“萤火虫乐园”在云南省文山州丘北县树皮乡树皮中学落成。该乐园是云南省第二所、全国第3
目的总结经皮门静脉穿刺激光消融(laser ablation,LA)治疗肝癌门静脉癌栓的可行性。方法超声引导下经皮经肝门静脉穿刺,穿刺针准确穿入癌栓的中心轴,直达癌栓的最近端,导入光纤
股票指数期货是20世纪80年代发展起来的新型衍生金融工具,具有价格发现,规避风险和资产配置的功能。能够有效完善证券市场的功能与机制,规避股票市场的系统性风险。但由于股指期