论文部分内容阅读
随着互联网的高速发展,图像数量急剧增长,并已成为人们日常生活中重要的信息媒介。然而,在图像的获取和传输过程中,不可避免地会造成图像质量的降低,这不仅会影响人们获取信息,而且还影响用户体验。图像质量评价旨在设计有效的数学模型使其自动、精确地预测图像的视觉感知质量,从而可以用于从海量图像中选择高质量图像或用于优化图像处理算法和系统,从而有效提升用户体验。因此,图像的质量评价方法具有重要的研究意义和应用价值。本文从保真度和可用度两个方面对图像质量评价研究,主要开展了以下两个工作:首先,在图像的保真度方面,提出了基于深度特征相似度的图像质量评价方法。现有的图像质量评价方法大多借助于手工设计的图像特征或浅层神经网络。然而,手动设计特征依赖于研究者的专业知识,且通常难以取得非常突出的性能。此外,浅层神经网络在图像表征能力方面也存在一定的局限性。由于深度神经网络在图像视觉领域的突出表现,我们提出了基于深度特征相似度的全参考型图像质量评价方法。该方法首先采用深度卷积神经网络分别从参考图像和失真图像中提取多层特征;然后,计算参考图像与失真图像在每一层的特征图的局部相似度,作为对应深度的局部质量描述;最后,对所有层的局部质量进行综合,得到图像的整体质量分数。该方法的预测结果的精度达到了90%,在四个常用数据库上的综合评价结果比现有全参考型图像质量评价方法平均高出1个百分点以上。此外,我们分析不同网络层的特征对最终结果的影响,同时也通过对比实验分析了不同综合方法对性能的影响。其次,在图像的可用度方面,我们针对基于内窥镜图像的肠道出血检测问题,研究了图像质量对于检测效果的影响。这里,我们主要考虑了旋转、高斯模糊、亮度变换、泊松噪声四种失真。通过对原始的内窥镜肠道检测图像进行不同类型和等级的失真变换,生成不同质量的图像。我们首先利用失真变换对训练集进行扩增,得到扩增数据集,分别使用扩增数据集和原始数据集训练模型,然后用训练好的模型进行分类预测,最后对比两种结果。之后,我们将使用扩增数据集训练好的模型应用于不同类型、不同等级的失真图像上,以分析不同失真对于检测效果的影响。为了提升实验结果的可信度,我们采用了四种不同的经典卷积神经网络结构。实验结果表明,对训练集进行质量扩增将检测精度从45.67%提升到了98.42%,避免了训练阶段可能会发生的过拟合问题;此外,亮度变换对于检测结果影响较大。整体而言,本文工作在理论方面有一定的创新,在实验结果方面取得了较大突破,将有利于对图像质量问题的深入理解和相关技术的推广应用。