论文部分内容阅读
随着数字媒体技术的飞速发展,人类已经进入到一个信息时代,海量的图像出现在人们生活的方方面面并发挥着重要的作用。由于在图像的采集、传输、存储到显示等各个环节都不可避免存在噪声,因此最终显示在用户端的图像会存在质量损失,即图像失真。在流媒体应用中用户对高质量的体验需求又在不断提高,因此需要预先对图像的失真程度进行评估,即图像质量评价。为了保证用户良好的观看体验,图像感知和质量评价成为一项必不可少的工作。随着大数据时代的到来,从图像数据中发掘规律,即数据驱动的图像质量评价方法显得尤为重要。本论文以图像感知为出发点,着重考虑人眼视觉系统特性,构建符合人眼视觉系统特性的质量评价方法,主要有以下几个方面的研究:1.针对图像失真类型多样性影响图像质量评价问题,提出一种基于多专家卷积神经网络的无参考图像质量评价方法。在实际应用中,图像失真类型多种多样,现有的图像质量评价方法并不能在每一种失真类型上都表现最佳,本文首先识别图像失真类型,得到该图像属于若干个失真类型的概率值;接着,针对每一种或一组失真类型训练特定的专家网络;最后,将识别模型输出的概率值和多专家网络预测结果融合起来得到图像的质量分数。通过实验分析发现,针对特定失真类型训练的专家网络与单一网络模型相比性能有很大的提升,说明专家网络能够学习到对特定失真类型敏感的有效的特征表达。在LIVE II和CSIQ数据集上的实验结果表明提出的基于多专家卷积神经网络的无参考图像质量评价方法预测结果与人眼视觉系统有很强的相关性。2.提出了基于深度学习的图像质量和用户满意度(Satisfied User Ratio,SUR)预测方法。根据人眼视觉系统的恰可察觉失真特性,人眼并不能察觉图像中的微小失真,只有当失真达到一定的阈值才能被感受到,这个阈值被称为JND。传统的JND模型关注像素域或者子带域,但是由于掩蔽效应等,图像中某个或者某些像素值超过其JND范围时并不一定能够被人眼察觉,本文关注的是图像级JND(Picture-level JND,PJND)。由于人眼的生理结构、视力状况、知识储备等不同,不同个体的PJND阈值也有所差异,因此为了表达群体的PJND,引入用户满意度的概念。用户满意度是指群体中对当前质量满意的用户比例。本文提出了基于深度学习的2D图像的SUR和PJND预测模型。对压缩图像的SUR进行预测更具实际意义,在给定用户满意度的条件下,可预测出最大编码参数、最大失真等级和最小码率。研究成果可直接应用于流媒体领域,节省图像编码码率进而大大减少流媒体运营商的成本。3.构建了基于PJND的对称和非对称压缩立体图像数据集。立体图像给人身临其境的视觉体验,这更符合人眼对周围真实世界的感受,然而,人眼对立体图像的PJND特性还需要进一步的探索,并且在本文之前还未出现基于PJND特性的立体图像数据集。本文通过主观实验研究立体图像的PJND特性,包括设置实验环境、收集立体图像数据、组织实施实验过程、对实验结果进行统计分析等。实验发现随着失真等级增大,SUR不断减小,说明失真等级越高导致用户的满意度越低。实验还发现JPEG2000非对称压缩的PJND左、右视点质量差异均值是2.12 d B,H.265非对称压缩的PJND左、右视点质量差异均值是2.38 d B。最后,构建了基于PJND的对称和非对称立体图像数据集,分别命名为SIAT-JSSI和SIAT-JASI,该数据集已经公开发布在IEEE Dataport平台。4.基于本文构建的面向PJND的立体图像数据集SIAT-JSSI,本文提出了立体图像的感知质量和用户满意度预测方法。首先,考虑到立体视觉的双目竞争机制和双目融合机制,从参考图像和失真图像对中提取特征,包括立体图像质量特征、单目视觉特征和双目视觉特征。然后,从提取的特征中选择关键特征并将特征融合再输入支持向量回归模型,学习特征空间到用户满意度的映射函数。由于立体图像数据集规模较小,采用了跨任务的迁移学习减少过拟合。在SIAT-JSSI数据集上的实验结果表明提出的方法性能较好。