论文部分内容阅读
伴随多媒体、网络与信息化的高速发展以及各类网络社交软件的普及,如何在浩如烟海的图像数据中筛选、评价、修复和增强图像的质量成为当下研究的热点。客观图像质量评价旨在利用数学建模和计算机理论设计出与人眼主观评价一致的算法,并以此来评价待测图像的质量。本文围绕人眼视觉系统的感知特性,探索空域结合频域视觉特性以及多层感知特性,重点研究了全参考图像质量评价方法和通用型无参考图像质量评价方法。本文的主要研究内容包括以下三个方面:(1)提出了一种基于空域结合频域分析的全参考图像质量评价方法,该方法通过空域视觉特征结合频域视觉特征来分析图像的视觉质量。首先,根据人眼视觉系统对图像的结构区域较为敏感的视觉特性,分别在空域和频域中提取图像的梯度特征和相位特征来量化图像的结构信息。其次,在频域中分析空间频率和纹理信息对视觉质量的影响。最后,通过随机森林来学习上述各个特征和人眼主观感知之间的关系,并以此建立归回模型。在公开的4个主流数据库中,大量的实验结果表明本文提出的全参考图像质量评价方法的性能优于当前主流的全参考图像质量评价方法。(2)提出了基于深度卷积神经网络的无参考图像质量评价方法。根据人眼视觉系统具有多层感知的特性,采用深度卷积神经网络GoogLeNet提取图像的低、中和高层视觉特征来模拟人眼视觉初级皮层的工作机理。然后,对各层卷积特征采取4种有效的池化策略,将池化后的特征信息输入至随机森林中进行训练,并以此建立无参考图像质量评价模型。在公开的4个主流数据库中对本文提出的无参考图像质量评价方法进行测试,实验结果证实该方法的性能总体优于现有的无参考图像质量评价方法。(3)针对传统的max-pooling和average-pooling等池化方法忽略了卷积特征各通道的权重信息,不能充分反映人眼主观感受的问题,本文提出了一种基于视觉加权的池化方法。该方法采用crow-pooling局部处理卷积特征中各通道间的权重和平面权重信息。其次,再对通道加权后的特征信息进行rmac-pooling来全局处理图像目标区域的权重信息。最后,结合传统的max-pooling和average-pooling来全局处理卷积特征中各通道的最大结构信息和平滑信息。该池化方法计算方式简单,同时以全局结合局部的方式来处理各层卷积特征,可以有效的模拟人眼视觉特性。