论文部分内容阅读
低码率感知音频编码利用了“感知不相干性”和“统计冗余度”来对音频信号进行压缩,以期以最少的比特数获得“透明音质”。AAC正是利用了这两种编码策略来大幅度地降低对音频信号进行压缩所需的数据量。MPEG-2 AAC已成为MPEG-4音频部分的核心标准,代表了当今最好的音频编码技术,是MP3指定的继任者。本文首先介绍了感知编码的基本原理,特别对心理声学模型作了重点描述,接着对AAC的各主要编码模块进行了深入的分析。在此基础上,本文对AAC标准建议的编码算法作了某些改进。在AAC中,比例因子用于对量化噪声进行整形,通过一种两层嵌套循环在码率和音质之间找到一个最佳平衡点。在AAC标准算法中,比例因子用的是霍夫曼编码,但用霍夫曼编码涉及到码书的计算、查找和存储等,特别当符号较多码书较大时,更为耗时和占用存储空间。而且,相对于霍夫曼编码,算术编码在某些方面拥有更优异的性能。因此我们尝试对MPEG-2 AAC中的比例因子应用自适应算术编码,以取代原先的霍夫曼编码,主要目的是在不损伤音质的前提下降低码率。自适应算术编码的性能很大程度上取决于概率模型的正确构造。一般的自适应模型只有在已编码符号数足够多的情况下,其概率模型才趋于准确。为了进一步挖掘自适应模型的潜能,针对音频编码的特点,我们提出了一种基于上下文的自适应模型,利用当前帧前面N帧已编码的比例因子的概率分布来对当前帧的比例因子进行编码。最后利用已有的软件平台,实现了AAC的编解码器,对将来进一步展开研究和实际应用打下基础。