论文部分内容阅读
随着我国信息化程度的不断提高,人们获取信息的方式从传统的文本形式逐步向视频、图像、语音等多媒体形式转变。新的信息获取方式给人们带来极大便利的同时,也给人们带来了大量的冗余信息。视频目标分割的主要目的就是从大量的冗余信息中准确高效的获取人们感兴趣的部分。作为计算机视觉的重要组成部分,视频目标分割在视频监控、智能交通、人机交互、搜索引擎等领域得到了广泛的应用,俨然成为了计算机领域的研究热点与难点。本文采用循序渐进的方式对视频目标分割算法进行研究,首先从像素级别上实现对视频目标的分割,然后考虑像素间的空域邻域关系对视频目标进行分割,最后实现多信息融合的视频目标分割,通过与其他算法进行对比实验,得出实验结果。具体工作主要包括以下几点:(1)对现有的视频目标分割算法进行分析与总结,得出现有的视频目标分割算法主要面临的技术难点,接着对它们进行适当分类,针对每一类别的目标分割算法提出可以改进的措施。(2)从像素点级别上对视频目标分割算法进行研究。在像素点级别上主要是采用基于混合高斯模型对视频背景进行建模来实现对视频目标的分割。然后采用平均背景模型和混合高斯模型对同一视频序列进行对比实验。(3)针对像素级别上视频目标分割算法的误分类现象严重的缺点,对算法进行改进。在考虑单个像素的局部特征外,还考虑空域邻域关系,提出基于条件随机场模型的目标分割算法。它除了对每个像素的纹理、颜色、位置、运动特性等特征建模,构建局部能量函数外,还考虑了8邻域范围内各个像素之间的相互作用,构建空域邻域能量函数。采用SAMME多类分类器对已标签的图像进行训练,获得模型的各个参数。最后对只包含局部能量函数的CRF模型和包含局部能量函数与空域邻域能量函数的CRF模型进行对比实验。(4)上述的基于CRF模型的目标分割算法仅适用于单幅图片中,对于其在视频序列中的应用,则需要对能量函数进行改进,加入一个约束因子来表征视频序列中相邻两帧或几帧图片中对应像素之间的影响,构建时域邻域能量函数。然后将基于CRF模型的视频目标分割算法跟基于混合高斯模型的视频目标分割进行对比实验。实验结果表明:基于混合高斯模型的视频目标分割算法复杂度低,实时性好,但由于它属于像素点级别上的目标分割,实验结果中误分类的现象较严重且前景目标中也会出现虫洞现象;基于CRF模型的视频目标分割算法可以很好的弥补这一缺点,而且该算法可以实现复杂环境下的多类目标分割,在处理多视角以及严重遮蔽的情形下,也能对目标进行很好的分割。