论文部分内容阅读
图像与视频分割,是图像处理、计算机视觉领域的一个重要研究方向,也是诸如目标跟踪与检测、行为识别、图像与视频编辑等众多基于图像与视频分析的高层应用的重要基础,能为各种高层视觉应用提供低层数据特征,因此,对该问题进行深入的研究具有重要意义与实用价值。运用图割理论解决图像与视频的分割问题,由于兼具全局最优性与统筹边界和区域信息的特点,近年来受到国内外学者的广泛关注。本文以图割理论为基础,主要针对图像与视频分割中的二元分割问题进行研究。具体工作如下:1.对运用图割理论进行图像分割的理论方法进行了系统总结。重点研究了网络流理论、能量最小化理论、s-t网络、最大流-最小割定理等,并对基于Graph Cuts的图像分割算法的理论框架与实现细节进行了探讨。2.对基于Graph Cuts的图像分割算法提出了两点改进措施。传统的基于GraphCuts的图像分割算法采用灰度直方图或亮度直方图进行颜色概率计算,本文采用高斯混合模型进行概率计算,从而可以直接处理彩色图像,无需转换;另一方面,传统的基于Graph Cuts的图像分割算法采用整幅图像中的所有像素点构建s-t网络,本文采用合并相同像素点的方法构建s-t网络,减少网络中的结点数,提高算法性能。3.提出了两种融合边界与区域信息的图像分割算法。GrabCut算法进行图像分割时可以有效地剔除前景目标中的内部背景区域,但该算法对前景和背景颜色信息接近的图像分割效果不佳;GCBAC算法可以有效分割前景目标的外边界,但不能剔除前景目标内部封闭的背景区域。本文融合这两种算法,提出一种融合GCBAC和GrabCut的交互式图像分割算法。该算法通过GCBAC提取边界,克服了前景和背景颜色接近对GrabCut的影响,同时,通过GrabCut剔除内部区域,克服了GCBAC不能有效分割内部区域的不足。基于以上思路,针对项目中的一个实际问题,本文提出一种融合Canny和GrabCut的商品图像自动分割算法。该算法通过Canny算法收敛到商品目标的边界,再利用GrabCut算法剔除商品目标内部的背景区域。该算法有效地分割出了商品目标,为下一步对商品图像的分析提供了准确的数据源。4.提出了一种扩展GrabCut的交互式视频分割算法。通过深入分析GrabCut算法的实现细节发现,该算法是一个迭代执行GMM标号、GMM参数估计和s-t网络切割的过程。对该算法的性能加以分析发现,当GMM模型趋于稳定时,算法的迭代仍在耗时,但分割效果基本不再变化。基于以上分析,本文提出一种扩展GrabCut的交互式视频分割算法。通过初始化时增加前景和背景颜色信息的提示,来保证GMM模型的准确性,通过在视频帧间迭代更新GMM模型来表征前景和背景的变化,通过实验结果证明,该算法可以较好地分割视频中的前景目标,达到了预期的结果。