基于特征学习的图像与视频质量评价研究

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:zk0529
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高速宽带网络的快速发展、4G移动网络的商用和智能终端设备的全面普及,以图像和视频为载体的多媒体内容越来越多的出现在我们的日常生活中。由于人类视觉系统对图像和视频中的块效应、模糊、噪声、传输失真等信号损伤十分敏感,因此保证用户对图像和视频内容的良好体验就变得极为重要。图像和视频质量评价正是其中一项基础而富有挑战性的工作。有效的图像和视频质量评价方法可以用于数码相机等设备的参数调整、图像和视频处理算法的标定和调整、视频传输网络的监控和网络资源的分配、推荐系统的图像排序等领域。主观质量评价是所有评价方法中最准确可靠的,但是由于耗时长、预算昂贵、评价结果无法重现等缺点,无法应用到实际系统中,因此需要研究与人类感知一致的客观自动的图像与视频质量评价方法。本文针对图像和视频质量评价的基本问题,在特征学习等知识的基础上,进行了客观无参考图像和视频质量评价方法的研究,此外还结合统计性指标融合,对全参考图像质量评价方法的性能增强进行了研究。本文主要工作概括如下:(1)基于无监督特征学习,提出一种通用型无参考视频质量评价方法。该方法不需要视频主观质量评价分数训练,包括帧图像特征提取、帧图像质量评价、时域平滑和池化三个步骤。在图像视觉词典基础上,采用无监督特征学习得到帧图像全局性质量感知特征,并利用帧图像客观质量分数对支持向量回归进行训练得到帧图像质量评价模型,最后将帧图像质量评价分数通过与人类视觉感知一致的平滑和池化方法进行聚合,得到视频质量评价分数。实验结果表明,该方法与现有需要视频主观质量分数训练的无参考评价方法性能相当。(2)基于图像块信息聚合,提出两种通用型无参考图像质量评价方法。两种方法均采用归一化的原始图像块作为图像局部特征,只需要很小的视觉词典,通过不同的方式学习图像全局性质量感知特征。第一种方法采用高斯混合模型聚类得到视觉词典,将局部特征分配给所有视觉单词,对模型的对数似然函数求导,实现局部特征聚合得到图像的全局性特征。第二种方法采用K均值聚类构造一个全面的视觉词典,除了视觉单词的均值,还计算每个视觉单词的协方差和协偏度对角矩阵。将局部特征分配给若干距离最近的视觉单词,通过计算局部特征与视觉单词之间高阶统计信息的直接差异,得到反映图像质量变化的全局性特征。两种方法均采用支持向量回归学习特征和图像主观质量分数之间的映射。实验结果表明,在仅有100个视觉单词的条件下,两个方法均能够快速有效地评价自然图像的质量,对于包含文字、图形、自然场景的混合图像和文本图像的质量也能较好地评价,还可以评价真实失真图像。(3)基于图像像素信息聚合,提出一种通用型无参考图像质量评价方法。将原始图像的局部二值模式算子引入到无参考图像质量评价中,通过对像素信息聚合,学习图像全局性质量感知特征。该方法不仅考虑图像失真对像素间灰度值差异的相对大小的影响,也考虑图像失真对像素间灰度值差异的幅值相对大小的影响以及对感知色彩空间内不同颜色通道的像素统计信息的影响。实验结果表明,该方法可以有效地进行图像质量评价和图像失真分类,并且对于彩色失真图像的质量评价明显优于已有的方法。(4)基于统计性指标融合,提出两种全参考图像质量评价增强的方法。首先采用现有全参考评价方法计算图像质量图,并提取若干统计性指标作为图像特征,然后分别利用支持向量回归对这些指标进行融合得到有监督的增强方法,利用倒数排序融合方法进行融合得到无监督的增强方法。实验结果表明,两种方法与主观质量评价分数有较好的一致性,可以有效增强已有的全参考图像质量评价方法。
其他文献
借着iPad等平板电脑在全球市场上的迅猛发展势头,酬Flipboard为代表的数字智能阅读应用程序也开始大行其道。。社会化阅读的风头正在比肩于Kindle等电子阅读器,成为移动阅读的
报纸
本文利用SBR反应器探讨了外加磁场在淀粉废水治理中的应用。实验表明,较高强度的磁场对淀粉废水的治理有较明显的效果,而较低强度的磁场对淀粉废水的治理没有明显的效果。
美国关于学前教育作为人力资本投入的教育经济学研究结果表明:学前教育投入有着很高的回报率,并且能够放大其他阶段教育投入的收益。我国学前教育投入的不足主要是由于不确定
在手机行业竞争日益白热化阶段,很多手机品牌纷纷倒下,HQ公司作为手机研发制造行业的佼佼者,逆势而上,订单不断增加,生产基地不断扩大,整体上呈现形势大好的局面。不过随着工
学校领导力的提出是当前学校变革与发展的诉求。学校领导力是学校组织成员在与学校内外环境互动的过程中为实现学校组织愿景和目标、推动学校发展与变革,影响他人并由此与学
通信原理是通信工程专业一门基础课程,该课程在课程体系中起着承前启后的作用,是通信领域基础理论知识的核心部分。针对该课程知识点多、信息量大、知识更新迅速等特点,应用
自2010年12月19日正式在苹果应用商店上线,社会化阅读软件扎客(ZAKER)目前的下载量已经接近40万。这个具有互动与分享功能的电子杂志群已经成为数字出版公司读览天下旗下重点开
报纸
<正> 我在《关于行为规范及其接受的认识》(探索之一)一文中已指出,行为规范的接受是把外在于主体的行为要求转化为主体内在的行为需要的内化过程,即品德结构的构建或对行为
甲氰菊酯(Fenpropathrin)是一类对光照和空气较为稳定的拟除虫菊酯类农药,被广泛用于苹果、桃树、栗树等害虫、害螨的防治。近年来,随着拟除虫菊酯类农药的广泛使用,甲氰菊酯在
建设和培养一支高素质合格的管制员队伍是民航实现飞行安全的基本保证。见习管制员是管制队伍中特殊的群体,他们刚褪去校园稚嫩的书生意气,张开怀抱迎接崭新的工作和生活。面