论文部分内容阅读
论文对图像分割和目标跟踪这两个计算机视觉中的基本任务进行了研究。在图像分割方面,基于主动轮廓模型(Active Contour Model,简称ACM)、梯度向量流(Gradient Vector Flow,简称GVF)、分水岭(Watershed)和Mean Shift等图像分割算法,提出了若干改进方案,并将其中两种算法应用到计算机辅助中医舌诊中的舌象分割任务。在目标跟踪方面,以Mean Shift跟踪算法为对象,提出了三种改进的目标跟踪算法,分别解决了目标尺度和方向的估计以及复杂环境下的目标表示问题。论文取得了以下主要研究成果:(1)提出了法线方向GVF(GVF in the Normal Direction,简称NGVF)和各向异性GVF(Anisotropic GVF)两种改进的主动轮廓模型外力场图像分割方法。NGVF以拉普拉斯算子沿法线方向的扩散代替GVF中的拉普拉斯扩散项;Anisotropic GVF依据图像的局部结构自适应选择拉普拉斯算子沿法线和切线方向的扩散速度。二者分别改进了GVF在进入细长凹部和保护图像边界等方面的性能。(2)提出了一种结合1维GVF(1D-GVF)和分水岭算法的图像分割方法。1D-GVF的扩散过程既使边界信息向光滑区域插值,又能在保留图像大尺度特征的同时,去除小尺度细节。处理后的图像具有适合于分水岭分割的良好结构,显著降低了过分割现象,为区域合并等后处理提供了较为可靠的统计基础。(3)提出了一种交互式区域合并算法。该算法从区域分割算法的初始结果中提取有意义的目标。它是一种基于最大相似度机制的区域合并算法,能够在用户定义标记的指导下,自动提取目标。(4)将1D-GVF图像分割方法和交互式区域合并算法相结合,用于计算机辅助中医舌诊。首先,基于1D-GVF和分水岭算法分割舌图像,得到初步的区域分割结果。其次,通过分析舌图像的结构特征自动设置目标标记和背景标记,运用提出的交互式区域合并算法提取舌象。最后,利用ACM算法进一步优化提取的舌象边界。(5)提出了一种尺度和方向自适应Mean Shift跟踪算法(Scale and Orientation Adaptive Mean Shift Tracking,简称SOAMST)。该算法基于矩分析和Bhattacharyya系数,在原始的Mean Shift框架下,估计目标真实的尺度和方向,增强了Mean Shift算法在目标发生较大形变时的适应能力。(6)结合背景和纹理特征,提出了两种目标表示方法,增强Mean Shift算法在复杂场景下的跟踪性能。第一种方法称为Corrected Background-Weighted Histogram (简称CBWH),该算法集成背景特征,通过降低目标模型中背景特征的概率,增强目标模型中的凸特征,抑制背景成分对目标定位的干扰。第二种方法基于Local Binary Pattern(简称LBP)纹理模型提取目标的关键点,结合颜色和纹理特征表示目标,增强了目标和背景的可分性。