论文部分内容阅读
随着3G网络在国内正式运行以及各种新的多媒体移动接入技术的相继涌现,为移动多媒体应用带来了广阔的空间和新的机遇。但是,由于移动通信环境的复杂性、无线传输频带资源的有限性以及传输信道的多变性,使得传统音频编解码技术遇到了新的困难,因此,面向3G网络的移动音频编解码技术就成为了移动多媒体应用领域一个新的重点研究方向。为了适应移动环境苛刻的应用需求,本文在国家自然科学基金重点项目“移动音频编解码基础理论与关键技术”的资助下,力争在提高编码效率、降低运算量两方面克服理论缺陷,突破技术瓶颈,深入研究了移动音频编解码中的一些核心关键技术,包括:移动环境下的人类听觉感知特性和心理声学模型、带宽扩展以及错误隐藏等。在此基础上,形成了本论文的主要研究成果,具体如下:1.移动音频混合编码的心理声学模型在移动多媒体应用中,音频信号的内容比较复杂。为了解决复杂音频信号编码的关键性问题,本文在EAAC+编码系统的心理声学模型部分,将PEAQ编码标准中心理声学模型有关人耳耳廓加权的方法移植到EAAC+编码标准中,使掩蔽阈值的计算更加符合人耳的生理特性,从而有效提高掩蔽阈值计算的精确度。这样既可以保持处理音频信号编码方面的优势,又可以提高对语音信号编码的能力。改进的算法不存在编码模式选择的问题,运算复杂度相对较低。而且,通过改进算法编解码后的音频信号与原始信号的时域波形比较接近,波形的包络形状和能量与原始信号也比较逼近,具有相当的质量。2.移动音频的带宽扩展技术本论文在EAAC+编码算法的基础上,针对输入的原始音频信号所存在的正弦分量,提出了一种检测并去除正弦分量的带宽扩展算法。首先将输入的原始音频信号分成低频和高频两部分,对于低频部分,仍然按照SBR算法执行。对于高频部分,按照BBSM算法,将整个高频频带再分为高频区的低频子带和高频子带,减少后续传输的码率。通过检测并去除正弦分量,可以实现降低算法的编码复杂度。根据主观与客观评测结果表明,论文提出的带宽扩展算法,进行高频扩展后的重建音频信号的高频频谱保持了原信号的基本频谱特征,高频频谱与低频频谱连贯性好。3.移动音频的差错隐藏技术差错隐藏技术作为解决传输过程中音频信号出现数据丢包现象的有效手段,一直是音频编解码算法研究的重要环节。为了保证在移动环境下使人类听觉系统感知不到数据丢包所带来的音频质量下降,研究一种基于3G通信的差错隐藏方案。通过在编码端检测音乐信号的短暂态信号,并将相关信息作为附加数据嵌入到压缩音频码流的数据单元中,然后在解码时将嵌入的附加信息解码去执行错误隐藏,以达到重建音频信号的音质。本文从理论、方法上针对面向3G通信的移动音频编解码关键技术开展了研究,其研究方法和研究成果为面向3G通信的移动音频技术的推广应用奠定了基础。