论文部分内容阅读
传统的视频编码标准,例如MPEG-1,MPEG-2,H.261,H.263等,采用基于块的编码方式进行视频编码,这些编码方法不仅编码效率低,而且没有考虑视频场景的按内容的真实构成。随着多媒体应用和服务的增加,特别是基于内容操作和具有交互式特性的多媒体应用的增加,例如按内容对视频数据进行检索和查询等,传统的编码方法已不能满足新的多媒体应用的需求,因此有必要采取一种新的编码方式按内容对视频信息进行编码。新一代的编码标准MPEG-4采用基于内容的视频编码,即在编码之前首先将视频场景划分成若干视频对象(VOP),然后根据各个视频对象的特征对不同的视频对象采取不同的编码方法。MPEG-4的基于对象或基于内容的视频编码技术不仅能大大提高编码效率,而且支持用户对多媒体数据按内容进行操作,例如基于内容的控制和比特流操作等。其中,视频对象的生成是基于对象的编码和交互式操作的基础,所以研究视频对象的生成具有重要的意义和应用价值。由于在视频序列中,人们注意及感兴趣的主体,一般是具有自主运动的物体,所以现有的视频分割算法绝大多数指的是视频中运动对象的分割,本文也主要讨论视频中运动对象的分割。本文讨论和建立了视频分割的理论模型,在建立的视频分割模型的基础上,通过从不同角度对视频构成进行分析,讨论了两种不同的视频分割方法:基于运动变化区域和边界特征的视频分割方法和基于时空信息融合的视频分割方法,建立了这两种分割方法的系统模型和一般实现步骤,并指出了其中涉及的关键技术。此外,针对背景静止的特殊情况,本文介绍了一种通过背景估计进行视频分割的思路,并且提出了一种自适应的背景估计方法。在基于运动变化区域和边界特征的视频分割中,本文提出了一种通过估计相对噪声特征参数对差分图像中的相对噪声进行滤波的运动变化区域自动检测技术。该方法首先在时间域上进行全局运动估计和补偿,并在全局运动补偿的基础上进行差分运算,得到差分图像,然后在差分图像中求得相对噪声的均值和方差的一个合理的初始估计值,并在此估计值的基础上采用迭代加权的方法逐步得到相对噪声的均值和方差的最优估计值;接下来根据最优估计值对差分图像中的相对噪声进行滤波,从而得到运动<WP=6>变化区域。另外,本文从模糊聚类的角度出发提出了另一种视频运动变化区域自动检测的方法,即通过建立的模糊分类准则在经全局运动补偿后的差分图像中对运动变化区域和相对噪声区域进行划分,从而得到运动变化区域。通过运动变化区域和当前帧中的边界特征相结合生成视频对象,实现视频分割。在基于时空联合的视频分割中,本文提出了一种符合人眼视觉特性的逐级划分的空间分割方法。对于空间分割后形成的各区域,按运动相似性和空间连通性对区域进行合并,从而生成视频对象。考虑到运动对象存在于运动变化区域中,本文提出了一种通过检测运动变化区域生成运动窗,然后只对视频图像在运动窗内的部分按时空特性进行分割的视频分割方法,这样使得运算量大大减少,提高了运算速度。此外,由于在区域的运动参数估计过程中涉及到对运动矢量的估计,因此本文还讨论了二维运动矢量估计的原理和一般方法,并提出了一种基于邻域子块的运动矢量预测的快速运动估计算法。在讨论了通过背景估计进行视频分割的理论后,本文提出了一种在静止背景条件下的自适应的背景估计方法,即首先将视频场景划分成若干块,然后通过一定准则确定当前帧中属于背景的块,并将各帧中属于背景的块合并,从而逐渐估计出完整的视频背景。在估计出完整背景后,采用将当前帧和完整背景进行差分的方法有效地分割出视频对象。根据以上各种方法,我们对实际的视频序列进行了测试,并对实验结果进行了分析,实验结果表明了上述方法的有效性,这也说明本文的研究工作在理论和实际应用中具有一定的价值,为视频分割的进一步研究打下了基础。