论文部分内容阅读
视频编码在视频信息的存储与传输中起到至关重要的作用。其主要作用是去除图像序列中的信息冗余。信息冗余主要表现在前后帧之间的相关性,因此,深入挖掘前后帧之间的相关性对于提高压缩比有着重要的意义。运动估计是相关性计算的一个重要组成部分,因此,在视频编码的研究中,运动估计的研究就成为了一个重要的研究方向。目前,国际上最先进的视频编码标准H.264中,使用了一种基于变尺寸块匹配的运动估计算法。这种方法将图像分成不同尺寸的块,为每个块求取一个运动矢量。本文对帧与帧之间的运动估计进行了研究。主要研究内容及结果如下:
(1)提出了一种改进的自下而上的高精度变尺寸块匹配算法。算法优点表现在:①无需计算阈值。对于变尺寸块匹配算法,一个很困难的问题是如何确定阈值来指导块模式的合并或细分。本文作者的做法是为每个小块保留所有最小匹配误差对应的运动矢量,并将这些矢量作为每个块的候选矢量。然后根据相邻块是否存在相同的候选矢量指导随后的合并过程。②提出了一种宏模式预测(Macro-Mode Prediction)的方法。这种方法依据宏块模式在相邻帧之间分布的相对稳定性,从上一帧的宏块分布预测当前帧的宏块分布。不仅提高了计算速度,而且不会降低预测精度。③针对基于候选矢量决定后续合并过程的方法容易受到光照变化的影响,提出了一种去除光照变化影响的后处理方法。
(2)提出了一种基于模型渐进细化(PMR)的全局运动估计算法。基于特征点的全局运动估计算法在选取特征点时主要依赖时间梯度和空间梯度。这种特征点选取方法不能很好地处理静态背景的情况。因此,本文作者提出了一种静态背景检测的方法。这种方法能够在全局运动估计之前检测出摄像机静止的场景。基于PMR的全局运动估计算法的主要特点是可以根据摄像机运动的复杂程度自适应选择运动模型进行描述。算法建立在三层金字塔结构上,模型的自适应选择发生在层与层之间。山顶层和中间层以及中间层和底层之间的模型选择模块选择运动模型,并在底层对所选模型进行校正。为了提高算法速度,本文作者引入了两种机制:①基于外块预测的稀疏特征点选取方法。该方法根据特征点的空间分布对特征点进行稀疏。同时利用上一帧外块的分布预测当前帧外块的分布,从而降低了外点对计算精度的影响;②使用了中间层模型预测的方法提高模型选择和计算速度。
(3)针对深度相差比较大的场景,提出了一种全局运动分层算法。该算法从图像顶部开始逐层寻找图像的主运动。然后利用每层得到的运动模型重建图像,求取该模型的支撑区域。然后对非支撑区域进行判断,看是否需要新增加一层。用与第一层相同的方法求取当前层的主运动。算法在达到图像底部或剩余区域不满足增加新层的条件时停止。每一层主运动都对应着某一深度的背景。而最后得到的不能为任何一层描述的区域即为对象区,其中包括对象和突出区域。