心理声学模型及其在感知音频编码中的应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:ytlytl1009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文从超额掩蔽、前后向时域掩蔽、FFT加窗系数分析和窗切换判据等几个方面对AAC心理声学模型进行了探讨。 研究表明,多个掩蔽音同时存在时的综合掩蔽能量并不是各单独掩蔽能量的线性相加,而是存在一个超额掩蔽。实验中本文按照弦度将各阈值分区分为纯音和噪音分量,对能量相似的相邻噪音或纯音信号,提高对应的信掩比来模拟它们共同作用的超额掩蔽效应。 通过将上帧信号的频域掩蔽量指数衰减后与当前帧频域掩蔽能量线性加权得到后向掩蔽量,并取其较大值为最终的掩蔽量。实验表明,在保证编码质量的情况下大多数音频信号都能有效提高模型输出的掩蔽能量。 文中对AAC的窗切换判据进行改进,将信号的时频域特性及瞬态编码特性结合,通过分析信号相邻帧高频能量的变化值、时域上幅度最大变化率及峰值位置检测,最终决定窗切换与否。实验结果表明,它在保证编码音频质量的情况下,能有效减少短块编码次数,降低编码误差。 本文首先用C语言实现了基本的AAC编码器,在此基础上对改进后的心理声学模型仿真,并对重建后的音频进行非正式听力测试,结果表明,在不增加心理声学复杂度的情况下,对于大多数音频能取得较好的编码效果。
其他文献
期刊
期刊
期刊
期刊
期刊
前向纠错(FEC)方式可以有效提高网络数据传输的可靠性。FEC方式由于具备延迟小、不存在反馈线路等优势,因而特别合适一对多的数据广播和实时性要求较高的场景,在当今的互联网应
期刊
随着信息化网络的发展,数字图像信息作为重要的信息之一,广泛被使用。如何有效的压缩和存储大量的图像信息已经成为研究的热点问题。分形图像编码是非常有前途和应用价值的新
期刊
OFDM是一种高频带利用率的多载波调制技术,它在提高频带利用率的同时,也能有效地抵抗字符间干扰。而同步技术是OFDM系统实现的关键技术之一。本文在现有的同步技术上提出了一种