1.2kbps MELP语音编解码算法的研究

来源 :教育科学博览 | 被引量 : 0次 | 上传用户:jianghui123789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:低速率语音压缩算法是一个复杂度较高、运算量较大、并且有着重要现实意义的课题。1.2kbps MELP算法是目前甚低速率压缩算法中较为优秀的算法。本文首先分析了语音压缩编码的现状,然后介绍了1.2kMELP算法的基本原理及比特分配情况,最后对1.2kMELP算法的性能作出了评测。
  关键字:语音压缩;1.2kMELP;线性预测
  Research on 1.2kbps MELP Speech Decoding
  MENG Jie
  (College of Information and Communication Engineering,Beijing University Of Post And Telecom,Beijing,100876)
  Abstract: Low bit rate speech decoding is a complicated subject but with important practical significance.1.2kbps MELP algorithm is one of the most excellence low bit rate speech decoding algorithm.It analyses the current status of the low bit rate speech decocing,then introduces the theory and the distribution of the sending bit of the MELP algorithm.At last,it assesses the performance of the algorithm.
  Key words: Speech decoding;1.2kMELP; linear prediction
  0 引言
  1981年美国公布的联邦标准线性预测编码算法LPC-10的编码原理在上一章有了简单的介绍,但是由于音质效果不令人满意,后来又提出了增强型的LPC-10e,结果仍然不理想。MELP编码算法是在LPC-10的基础上加入了多带混合激励、非周期脉冲,残差谐波谱处理、自适应谱增强以及脉冲整形等五种关键技术,使得1.2Kb/s速率的MELP语音质量优于2.4Kb/s的LPC-10语音编码。语音质量提高、编码速率下降的同时,编码复杂度大大提。
  1 1.2kMELP声码器原理
  1.1 MELP声码器的关键技术
  MELP声码器结合了混合激励和多带激励的思想,以LPC模型为基础,同时在激励信号产生和基音提取方面做了一些改进,提高了语音合成质量。这些方法主要包括多带混合激励、使用非周期脉冲、残差谐波谱处理技术、自适应谱增强技术和脉冲整形滤波。
  (1)多带混合激励
  MELP模型使用5个叠加而成的分带滤波器将语音信号分成0~500Hz,500~1000Hz,1000~2000Hz,2000~3000Hz, 3000~4000Hz五个频段。滤波后的语音信号经过全波整流及平滑滤波,进行清/浊音判断来得到对应的频带基音。MELP模型使用一个随频率变化的清/浊音判决器来代替LPC模型中简单的清/浊音开关。用混合激励去到了LPC中简单的二元激励,这样使得从频域上对激励信号的的划分更加精细,合成的激励也更加准确,这种改进减少了LPC声码器中常有的蜂鸣声,对宽带声源改进的效果十分明显。
  (2)使用非周期脉冲
  LPC模型中将语音分为清音和浊音,而MELP模型将采集的语音信号分为三类:清音、浊音和抖动浊音。抖动浊音是将一些周期性不是很强的浊音段用非周期标志来标识,在接收端解码的时候根据接收到的非周期性标志位来判断该语音帧时抖动浊音还是浊音,若为抖动浊音,则在基音周期在一个区间随机变动来减弱合成语音的周期性。这样做可以很好的模拟那些不稳定的声门脉冲,从而使合成的语音更加逼近原始的语音激励。
  (3)残差谐波谱处理技术
  残信号往往含有大量语音信息,但是由于需要控制码率,所以以往的低速率语音压缩算法在生成激励时,忽略它的幅度特性,只关注它的周期性。MELP单独使用几个比特来对残差信号进行处理,但是这几比特仅仅用于描述残差信号的重要特征—各基音周期谐波处的傅里叶级数幅度值。1.2Kb/s的MELP算法对最低10阶谐波的傅里叶级数进行量化,10阶以上的傅里叶级数值认为是平坦的。对残差信号进行传输,大大提高了合成语音的清晰度、自然度、抗背景噪声的能力,改善了传统LPC模型合成语音的嘶哑,发闷和合成音重等缺点。
  (4)自适应谱增强技术
  传统的LPC的合成滤波器采用全极点的模型,其极点的位置与自然语音的共振峰存在偏差,导致了共振峰之间的合成语音谱的波谷没有原始语音的波谷尖锐,从而使合成语音听起来发闷。MELP算法引入了自适应谱增强技术来改善这一情况。自适应谱是指让吉利信号经过自适应谱增强滤波器来实现的。
  (5)脉冲整形滤波
  脉冲整形滤波是通过脉冲散布滤波器来实现的,脉冲散布是基于谱平整的三角脉冲定长滤波器来实现的,该滤波器能将激励信号的能量较均匀的分布到整个语音信号的频谱段上。通过脉冲整形滤波之后在解码端输出地合成语音中,远离共振峰的波形的峰值被减小了,使输出的语音听起来更加自然。
  1.2 MELP声码器的编码原理
  下图为1.2kMELP声码器的编码框图,与2.4k的MELP算法一样,1.2kMELP算法也分为两步:参数的提取与参数的量化。抽样后的语音首先经过一个四阶的切比雪夫滤波器做预处理,除去语音信号中的直流工频干扰,然后信号经过多五个带通滤波器将信号分成5个子带信号,然后进行参数的提取,其中需要提取的参数包括:基音周期、子带清浊音强度、增益、线性预测系数、傅里叶级数的幅值。进行参数量化时,其他系数都与2.4kMELP量化方法一致,进行直接量化。对于线性预测系数LSF,1.2Kb/sMELP算法采用三帧联合量化编码,仅对第1、3子帧的LSF参数进行量化和传输,解码端通过内插得到第二帧的LSF参数。这样量化时利用帧间的相关性,节约了量化比特,减低了码率。   图1 1.2kMELP声码器编码框图
  1.3 MELP编码参数的比特分配与发送
  本算法中将2.4Kb/sMELP算法中的单帧帧长由22.5ms增加到25ms,其次,本算法将相邻的三帧联合起来组成超级帧,然后对超级帧进行编码解码。编码的比特数为90比特,而每个超级帧的帧长为75ms,共600个样点,此时编码速率为90/0.075=1200b/s。这90比特中包括LSF参数、增益参数、傅里叶频谱、基音周期参数、带通清浊音判断参数。具体的比特分配如下表。
  表1 MELP编码参数比特分配表
  2 MELP算法性能测试
  2.1 合成语音波形图
  首先选取一段PCM格式的语音文件,分别将它进行1.2kMELP及2.4kMELP的压缩编码,随后进行解码,语音合成。使用Cool Edit软件将两种速率的MELP算法合成的语音文件与原始语音文件进行比较,如下图:
  图2 原始语音波形
  图3 2.4kMELP合成语音波形
  图4 1.2kMELP合成语音波形
  通过以上的波形对比可以看出原始的语音信号在时域和频域上与重建出的波形都有一定的差别,2.4kbps压缩速率重建出的语音波形较之1.2kbps的压缩更接近于原始波形,由于2.4kbps速率的MELP压缩是采用每帧单独编解码的算法,它忽略的帧间的相关性,所以在波形上与原始语音数据还是有差别的,然而1.2kbps的MELP压缩算法是采用三帧联合量化,这样可以利用帧间的相关性,所以即使是采用较少的比特进行量化,仍能获得较好的语音量化质量。
  2.2 合成语音质量测试
  此实验邀请10名同学在安静环境下对2.4KbpsMELP及1.2KbpsMELP编码算法进行MOS主观评价测试。具体方法为,参加测试的10名同学从MOS评价方法划定的5个等级中选出其中某一级作为测试者对测试语音的品定,然后对总的MOS评分取平均值。实验结果如下表:
  表2 2.4k MELP算法MOS评分
  表3 1.2k MELP算法MOS评分
  由以上评分可得2.4KbpsMELP算法的平均MOS得分为3.2,1.2KbpsMELP算法的平均MOS得分为2.8,实验表明,1.2KbpsMELP具有足够的可懂度,但是自然度以及在讲话人的确认等方面还不够好。
  2.3 算法延时测试
  在1.2kbpsMELP算法中,为了达到更好的语音压缩质量,算法采用三个单帧组成一个超级帧进行量化,单帧长度为25ms,超级帧长度为75ms。由于一帧25ms长度较短,本实验选取一段长度为150ms的语音文件,对它进行100次的压缩单独测试编码延时,随后进行一百次的解压单独测试解码延时,然后又进行100次编码后直接解码的运算求出编解码的总延时。经过试验,100次压缩耗时9402.463ms,单独解码100次耗时30128.4887ms,连续压缩解压100次耗时35317.5635ms,由此可以得出1.2kbpsMELP算法延时结果如下表:
  表4 1.2kMELP算法延时测试
  由上表可以看出,本文设计的甚低速率语音编码算法的编解码总延时小于200ms,满足实时传输的需求。
  3 结论
  本论文介绍的1.2k MELP算法,将三个长度为25ms的单帧组成一个75ms的超级帧进行联合量化,编码的比特数为90比特,达到了1.2k 的速率目标。通过合成语音波形相似度、合成语音质量、算法延时三方面的评测,验证了此MELP算法具有实时压缩的能力,并且合成语音质量良好。
  [参考文献] (References)
  鲍长春. 低比特率数字语音编码基础[M]. 北京:北京工业大学出版社,2001.
  郭莉. MELP甚低速率语音编码算法研究[D]. 北京:北京邮电大学,2008.
  鲍长春. 数字语音编码原理[M], 西安:西安电子科技大学出版社,2007.
  胡航. 语音信号处理[M]. 北京:电子工业出版社,2000.
  张巍. 基于MELP的甚低速率语音编码算法研究[D]. 北京:华北电力大学,2007.
  王洪. 低速率语音编码[M]. 北京:国防工业出版社,2006.
其他文献
摘要:高职院校中“三困生”的心理状态受到来自社会、家庭、学校等方面的影响,这些影响使这一群学子的心理健康偏低,从而他们的生活、学习等都受到了影响。结合高职院校的这一实际情况,我们应该普及积极心理学,让这一群学子走出不健康的阴影,树立积极、健康向上的心态。  关健词:高职院校 三困生 心理辅导  近年来,高职院校“三困生”的现状得到越来越多的人的关注,“三困生”作为高职院校中的一个特殊群体,置身于社
期刊
摘要:准晶自发现并提出以来,一直是材料科学界所研究和关注的热点。作为一种新兴材料,准晶的研究价值也是不言而喻的。了解准晶的最新研究现状对于即将从事准晶研究或已经从事准晶研究的科研者具有极其重要的意义。本文通过查阅各种文献资料,对准晶的结构和准晶的分类进行了综合介绍,对准晶形成机制的研究现状进行了系统描述,对目前准晶的制备方法做了一一说明。  关键词:准晶;形成机制;新兴材料。  The Prese
期刊
摘要:所有的计量结果都会因各种因素产生一定的误差,由于计量结果关系到企业的经济效益,因此,设法降低原油交接计量的误差,提高整个计量过程的准确性非常重要。文章分析了原油动态交接计量过程中影响计量准确性的几大因素,并结合实际情况分析造成原油计量误差的原因,并有针对性的提出降低计量误差的措施。  关键词:原油密度含水测定 管线温度压力 流量计 消气器  原油动态计量即采用流量计计量原油的方法在整个原油交
期刊
摘 要:本文结合3种代用燃料(地沟油、DME、生物柴油)与柴油的主要理化特性,分析了其日常使用要求及对发动机燃烧的影响等。测定3种代用燃料与柴油的密度、凝点、闪点,分析了其日常使用要求的不同;进行粘温特性试验、蒸馏特性试验,对比3种代用燃料与柴油粘温特性和蒸馏特性的不同,并应用数值回归方法分析每种燃料的粘温特性数据;应用经验公式计算每种燃料的表面张力,并分析其对发动机燃烧的影响。  关键词:代用燃
期刊
摘 要:原油中一般都含有石蜡,抽油过程中原油中的蜡逐渐在抽油杆和管壁上凝结,载荷逐步增大最终导致油井停抽,防蜡和清蜡在世界的大部油田都是原油生产的重要举措。在传统的防蜡技术有加热、添加化学防蜡剂、使用强磁场等,但从效果、成本、能源消耗和环境影响诸方面综合考虑,这些方法均存在一定的局限性。  关键词:清防蜡、合金防蜡器、电化学  1. 概述  目前国内的清防蜡技术主要有热洗清蜡、加注液体化学清防蜡
期刊
摘要:对电客车轮对几个关键参数值含义以及目前南京地铁采用的几种测量方法进行简要阐述和分析。  关键词:电客车, 轮对, QR, 轮缘高,测量方法  1 轮对参数概述  电客车轮对承载着车辆的全部重量,运行时承受着从车体以及钢轨两方面传来的静、动作用力,受力复杂,是影响车辆运用安全的关键部位。轮对参数包括轮对内侧距L,轮径尺寸D,轮缘高度Sh,轮缘厚度Sd,轮缘综合值qR。目前南京地铁一号线采用的轮
期刊
班主任是学校的支柱,是学生发展的指导者,是学校、社会各种教育力量的整合人。学生的成长需要班主任的培养与教育,尤其是农村出现寄宿制小学后,班主任肩负的担子就更加繁重了.一个能够得到较好发展的人,不只是“学会生存”,还要“学会认知”和“学会共同生活”.因此在新形势下,班主任就必须不断学习新知识,研究新情况,解决新问题,才能 做好“监护人”,才能成为掌握现代教育艺术的“多面手”,才能 扮演好种种角色,以
期刊
摘要:正确的安装热工仪表测量元件,对机组安全经济稳定运行显得尤为重要。本文论述了温度、压力、流量测点开孔位置的选择,图纸设计要求,接管座尺寸选择原则。  关键词:压水堆核电厂;热工仪表;测点位置;接管座  中图分类号:TH81  Discuss the Location and Design Principle of Thermodynamic Instrumentation in Pressur
期刊
摘要:介绍了船舶舾装生产设计过程中的重要环节:舾装生产设计概述、准备和要领,对舾装生产设计内容作一个相对全面的介绍。  关键词:船舶舾装,生产设计,舾装生产设计  第一、 舾装生产设计概述  1、舾装生产设计的定义  舾装生产设计是对造船施工的各种工程技术问题进行分析研究,对制造方法和有关技术措施作出决策,并用图、表和技术文件等方式表达出来,作为编制舾装生产设计计划和指导现场施工的依据。  舾装生
期刊
摘 要:信息技术应用到中学物理教学中,构建开放而富有活力的新型的课堂教学模式,实现教与学的最优化。信息技术与物理学科教学的整合,正在成为当前我国信息技术教育乃至整个教育信息化进程中的一个热点问题。在整合过程中,何时、何处引入信息技术,如何整合才能得到好的效果,如何评价整合效果是我们要解决的问题。  关键词:信息技术 中学物理 教学应用  自从2003年国家启动了“校校通”工程以来,将信息
期刊