论文部分内容阅读
大数据时代的到来带来了海量的多媒体信息,人们的生活也随之变得丰富多彩。人们往往倾向于选择质量较好的多媒体信息,如清晰的图片和视频、音质良好的音乐等。然而多媒体数据的爆炸式增长带来的是质量的参差不齐,因此在大数据时代下,研宄多媒体信息的质量评价方法,进而帮助人们作出正确的选择,成为了亟待解决的问题。在音频领域中,当前流行的大多数音乐分享平台仅仅根据音频的一两个参数作为评价音频质量的标准,而这其实并不合理,因为首先音乐质量与人类听觉系统有关,受多种因素影响,不能仅仅根据一两个简单的参数来衡量。其次,由于虚假质量的音频存在,使得根据比特率评价音频质量的方法变得更加不可靠。传统的音频主观评价方法和客观评价方法由于各自的局限性,都不能很好的解决这个问题。本文从机器学习的角度出发,研究了音频质量的影响因素,针对不同的应用环境,提出了基于流型排序的SVR无参考音频质量评价方法和基于FVV的虚假质量音频评价方法,具体研究成果如下:(1)介绍了多媒体质量评价技术的综述性内容,其中包括研宄背景和意义,图像质量评价、视频质量评价、音频质量评价等概述内容,并总结归纳了多媒体质量评价的国内外研宄现状。重点研宄了音频质量评价的理论框架,分析了人类听觉系统和心理声学现象,总结归纳了当今广泛应用的主观音频质量评价标准ITU-RBS.1116-1,客观音频质量评价标准ITU-R BS.1387,并分析各自的优缺点和应用场景。(2)提出一种更有效的无参考音频质量评价方法。当前音频质量的无参考评价方法研究起步晚(2013年才首次有人提出),研究成果很少,本文针对当前无参考音频质量评价方法只是从每个音频中提取特征,并对音频质量评价,并没有考虑音频质量之间的关系的不足,通过流形思想考虑音频之间的关系,提出基于流形排序的SVR无参考音频质量评价方法,并与前人所提方法进行比较,有效提高了评价的准确性,推动了本领域的发展。(3)针对当前出现的虚假质量的音频进行评价。为此,首先研宄了应用最为广泛的MP3音频的编解码过程,对虚假质量的MP3音频的产生原因进行分析,通过估计虚假质量的量化MDCT的FVV特征,评价音频质量是否真实,并且能够揭示虚假质量的音频的真实质量。与前人算法的对比实验中,本文所提FVV方法在四种算法中表现优秀。