论文部分内容阅读
数字音频编码技术广泛应用于音频存储和网络传输,满足了人们对音频信息的需求。音频编码压缩算法包含很多,它们在计算复杂度、压缩质量以及压缩比等方面存在着很大的差异。近些年来,人们利用人耳听觉系统原理设计出了高压缩、高保真的编码算法已取得了很大的进步,这种音频编码算法称之为感知音频编码。MPEG-4AAC音频编码是目前最先进、最流行的感知音频编码技术,它在保证音频编码质量的前提下提供了较高的压缩比。但是AAC音频编码标准的算法存在很高的计算复杂度,不能满足实时音频编码的需要,因此本文通过对MPEG-4AAC音频编码标准的研究,在不影响音频编码质量的前提下,提出了有效的改进措施。首先,介绍了AAC编码器的基本原理,包括:AAC编码标准提供的三种编码框架模型、AAC编码器的编码过程。接下来对心理声学模型、分析滤波器、联合立体声、量化编码和比特分配等模块中的相关算法进行了详细的介绍。其次,心理声学参数的计算在MPEG-4AAC音频编码器中占了很大的比重。在心理声学模型标准中,掩蔽效应特性(特别是计算临界频带之间的掩蔽效应)的计算存在了大量的重复计算过程。通过对该计算过程的研究,提出了一种减少该计算过程的算法,该算法并未影响编码质量,提高了编码效率。最后,量化模块是AAC音频编码器中最耗时的计算。该模块采用了Brandenburg提出的双循环模式,取得了较好的编码质量和压缩比例。但在实际编码时,该方法由于迭代次数过多,会出现收敛速度较慢、甚至死锁的情况。本文在深入分析MPEG-4AAC量化算法的基础上,提出了一种快速计算每个比例因子频带的比例因子的算法。该算法通过有效减少外循环计算过程,并确保每个比例因子频带的量化失真低于允许值,从而减少量化模块的计算量。