3GPP AMR-NB与ITU-T G.729ab间的语音转码方法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:candle819
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无线通信网络与IP网络的互通与融合已成为未来通信发展的一个主要方向。其中,由第三代合作组织(3GPP)标准化的自适应多速率窄带(AMR-NB)语音编码算法已应用于第三代移动通信系统。与此同时,由国际电信联盟(ITU-T)标准化的G.729ab语音编码算法也被广泛应用于VoIP等分组交换网络中。 为了实现上述两种通信系统间的互通,则需要进行编码标准间的转码操作。目前有关转码的研究大多不涉及使用非连续传输(DTX)情况下的转码操作,在源编码系统和目标编码系统一方使用、双方均使用或双方均不使用DTX情况下,还没有一套完整的AMR-NB与G.729ab间的转码方法。鉴于此,本文根据华为技术有限公司的实际需要,提出了一套完整的支持DTX和FEC功能的3GPPAMR-NB与ITU-T G.729ab间相互转码的方法。 当源编码系统和目标编码系统均不使用DTX时,本文采用基于不同域的转码方法进行语音帧参数的转码操作。在码书增益参数转码时,提出一种基于缩放失真测度的转码方法。该方法转码后的合成语音质量高于级联(DTE)方法,并且保证了转码后合成语音平均分段能量与DTE方法相近,去除了能量差异对主观听觉质量的影响,并使码书增益参数转码部分的计算复杂度降低为零。当源编码系统和目标编码系统一方或双方均使用DTX时,本文提出了用AMR-NB的话音激活检测(VAD)算法确定目标帧类型的方法,该方法在正向转码时使计算复杂度降低1个WMOPS以上,并使源编码系统和目标编码系统在一方使用、双方均使用或双方均不使用DTX情况下的转码方法的融合成为可能。还提出了语音帧参数与非语音帧参数间的转码方法。在发生丢帧情况下,本文采用了一种基于线性预测的基音参数恢复和转码方法,该方法提高了在发生丢帧情况下转码后的合成语音质量。 最后,对所提出转码方法的主客观合成语音质量、客观语音质量的95%置信区间下限值、平均计算复杂度、最坏情况下的计算复杂度和所需存储空间与DTE方法进行了比较。综合测试结果表明,所提转码方法在主客观合成语音质量均不低于DTE方法的前提下,使平均计算复杂度较DTE方法降低了28%及以上,最坏情况下的计算复杂度较DTE方法降低了26%及以上。将本文所提出的转码方法应用于实际的转码系统中,在满足用户需求的前提下,能够使运营商的运营成本降低25%以上。
其他文献
随着现代通信技术的不断发展、智能手机等便携式终端的不断普及,人们对于基于位置的服务需求越来越强烈,特别是在室内场所中,利用位置服务获取所需要的信息,已经成为人们生活
随着现代通信技术、多媒体技术的迅猛发展和计算机微型化的进步,短距离高速率无线穿戴式信息网络已成为一个研究的热点。穿戴式信息网络是一类超微型,可穿戴的移动信息通信系统
认知无线电基于感知的频谱共享接入能够根据频谱感知结果灵活分配传输功率,从而有效提高授权频谱利用率,是认知无线电技术的重要发展方向之一。这种接入方式既能严格限制功率传
异步无线传感器网络在监测区域内监测数据,但是却不能够将监测数据实时地传送给授权节点,因而,数据需要存储于网络之中。然而,鉴于传感器节点的资源受限,需要尽可能地减少网络中存
随着移动通信的不断发展和信息处理技术的不断进步,人们已不满足于传统的文本、语音业务,能够实时的获得视频信息是人们期望得到的一项新型通信服务。移动视频业务的开展不但
认知无线电网络中主用户的随机出现会随时中断授权频带中认知用户通信服务,因此,频谱切换技术是保证认知无线电网络中认知用户通信连续性的关键技术。本论文的主要研究工作如
随着互联网技术的迅速发展,社交网络逐渐成为一种快速便捷的信息分享和交互平台。作为当前国内社交网络巨头之一,新浪微博热门话题的讨论提升了微博用户的参与感和活跃程度,形成