论文部分内容阅读
本文从超额掩蔽、前后向时域掩蔽、FFT加窗系数分析和窗切换判据等几个方面对AAC心理声学模型进行了探讨。
研究表明,多个掩蔽音同时存在时的综合掩蔽能量并不是各单独掩蔽能量的线性相加,而是存在一个超额掩蔽。实验中本文按照弦度将各阈值分区分为纯音和噪音分量,对能量相似的相邻噪音或纯音信号,提高对应的信掩比来模拟它们共同作用的超额掩蔽效应。
通过将上帧信号的频域掩蔽量指数衰减后与当前帧频域掩蔽能量线性加权得到后向掩蔽量,并取其较大值为最终的掩蔽量。实验表明,在保证编码质量的情况下大多数音频信号都能有效提高模型输出的掩蔽能量。
文中对AAC的窗切换判据进行改进,将信号的时频域特性及瞬态编码特性结合,通过分析信号相邻帧高频能量的变化值、时域上幅度最大变化率及峰值位置检测,最终决定窗切换与否。实验结果表明,它在保证编码音频质量的情况下,能有效减少短块编码次数,降低编码误差。
本文首先用C语言实现了基本的AAC编码器,在此基础上对改进后的心理声学模型仿真,并对重建后的音频进行非正式听力测试,结果表明,在不增加心理声学复杂度的情况下,对于大多数音频能取得较好的编码效果。