论文部分内容阅读
近年来,随着数字视频技术和先进计算机技术的迅猛发展,多媒体视觉信息正在以不同的途径和方式进入人们的日常生活,如:数码相机,网络视频,视频会议和视频监控等,得到了广泛的应用且扮演着越来越重要的角色。然而,视频在采集、存储、处理以及传输的过程中难免遭受各种不同类型和程度的失真干扰,影响人们在观看视频时的感知质量。因此,对视频进行质量评价的研究具有非常重要的实际意义和应用价值。视频序列由于具有区别于二维图像的时域存在,更为复杂且难以描述,因此利用二维处理方法对视频序列进行频域变换无法有效地对视频序列进行特征提取和失真描述。本文将视频序列看作三维数据信息,通过引入时空域三维变换,提取视频序列的时空域特征信息,然后利用时空域信息设计能够准确描述视频降质程度的特征,以此进行视频质量的评测。最后结合人类视觉系统的特性进行时空域融合得到整个视频序列的评价质量。本文提出了一种基于三维离散余弦变换(Three-Dimension Discrete Cosine Transform,3D-DCT)的半参考视频质量评价方法。针对压缩视频失真的特点,利用3D-DCT高频系数的统计特性设计了三种半参考特征,通过计算参考和失真视频序列的特征差异并结合基于人类视觉感知特性的特征融合,对视频序列进行质量评测。实验结果表明,该方法与人类主观质量评价结果具有较高一致性,评价性能优于现有半参考质量评价方法以及部分经典的全参考质量评价方法。另一方面,该方法能够较好地平衡预测精度和特征信息量。此外,本文还提出了一种基于三维梯度相似度的全参考视频质量评价方法。在对视频序列进行时域子序列划分后,利用三维梯度核对视频子序列进行三维卷积,得到视频子序列中每个像素在横轴、纵轴及时域轴三个方向上的三维梯度。然后,计算三维梯度相似度作为局部视频质量测度,并结合人类视觉感知特性进行时空域质量测度融合,得到整个失真视频序列的质量测度。实验结果表明,该方法计算简单,相较传统全参考视频质量评价方法在性能上有所提高,与主观质量评价具有较高一致性,能够较好描述人类视觉系统对视频质量的感知特性。