论文部分内容阅读
目标跟踪是计算机视觉领域的一个基本问题。复杂背景下扩展目标跟踪是光电成像跟踪系统中的一个关键技术,在实际场景中有广泛的应用。但跟踪过程中,目标所处的背景改变,目标自身的形态变化,以及背景对目标的遮挡,都会导致跟踪漂移甚至完全丢失。虽然国内外已有大量经典的算法提出,但在实际应用中仍存在许多问题。针对这些问题,本文首先分析了基本跟踪框架的组成及其存在的缺陷,然后结合扩展目标跟踪实际项目中亟待解决的问题,参考国内外目标跟踪领域的前沿算法,对复杂背景下的目标跟踪技术进行深入细致的研究,并提出了一系列新颖可行的算法。概括地说,主要包括以下几个方面:首先,深入研究了目标过程中的一个关键问题:图像特征的提取、评价和改进。对于计算机视觉问题而言,所采用的图像特征的质量直接决定了算法性能的上限。论文首先对扩展目标跟踪领域常见的基本图像特征和基于生物视觉理论的局部不变特征进行归纳总结。在此基础上,提出了评价特征质量的三个参数:鲁棒性、区分性和实时性,用于解决实际跟踪中的特征评价和特征选择问题。在工程应用中,首先,针对可见光条件下的圆柱状飞行器跟踪问题,对多种图像特征用所提出的参数进行评价,然后对特征和特征描述方法进行改进,采用局部二值化模式(LBP)纹理特征结合Hu不变矩特征描述方法,以及加权的模板更新方法,实现了对该类扩展目标比较良好的局部跟踪效果。其次,针对杂波背景下几何形态剧烈变化的扩展目标跟踪问题,提出了一种基于自适应最优聚类的匹配跟踪算法。该算法创新性地诠释了图像的熵特征在非监督聚类理论下的物理意义和生成方法,然后采用模式识别中的误差平方准则和散布准则优化聚类性能和聚类参数,据此提出了一种改进的融合了图像灰度分布和几何分布的图像特征-扩展多尺度熵特征(EMSE),实现了对该类扩展目标的稳定精确的局部跟踪。其次,本文深入研究了一种实际应用中取得了良好效果的扩展跟踪方法-基于分块模板(patch)的跟踪方法。在分析了基本分块跟踪算法优势和缺陷的基础上,对其进行改进和扩展,以提升算法在背景快速变化、遮挡、目标形态变化下的跟踪性能。针对跟踪波门(bounding box)中同时存在背景分块和目标分块的问题,论文采用TLD算法中提出的基于时间轴可逆性的前后向偏差来剔除跟踪波门中的背景分块和被遮挡的目标分块,保存未被遮挡的目标分块进行前后帧匹配跟踪,从而实现了在背景快速变化和遮挡下的稳定精确匹配;同时,针对跟踪过程中目标放大缩小的问题,采用提纯后的SIFT特征点对进行匹配,计算匹配点对的平均点间距离比值,用该比值作为目标前后帧间的尺度缩放系数对目标波门大小和分块模板大小进行更新,从而实现在扩展目标扩大缩小条件下的精确跟踪;针对背景变化和遮挡下的模板更新问题,采用SAD匹配方法筛选出稳定目标分块,同时采用基于灰度直方图的主灰度分量逆投射算法区分出不稳定目标分块和背景分块,进而对所有目标分块进行更新以使模板能及时捕捉目标的变化,背景分块不更新以避免背景干扰。将提出的算法与最新的算法进行了充分严格的性能对比测试,测试表明,对背景快速变化下的遮挡目标,所提出的算法跟踪效果显著优于已有算法。最后,本文研究了机器学习理论在扩展目标跟踪中的应用。作为人工智能的两个领域,机器学习和计算机视觉有着天然的联系。机器学习领域的一个核心问题也是监督或者非监督下条件下数据特征的学习和提取,由于运算速度的限制,这种基于机器学习的在线图像特征提取很难应用于实时目标跟踪,但在计算机视觉其他应用领域如目标检测和识别得到广泛应用。论文从基于人眼视觉机制的图像稀疏表示理论出发,研究稀疏表示下的字典学习理论(Dictionary Learning)在扩展目标跟踪领域中的应用。从目标跟踪的角度,字典构造可以理解为目标多模板的提取,稀疏系数求解可以理解为多模板下的目标匹配,字典更新可以理解为模板更新。在研究了已有算法的基础上,结合具体应用,论文采用基于主成分分析(PCA)理论的字典构造方法,针对扩展目标跟踪中的目标遮挡和背景干扰问题,对基本的Lasso方程进行改进,同时采用增量学习方法对字典进行更新。将改进后的字典学习方法与粒子滤波(PF)跟踪框架结合,提出了一种新的观测方程以适应目标遮挡情况,同时根据遮挡情况对增量学习中的样本进行筛选,从而提高遮挡情况下目标模板的更新效果。鉴于粒子滤波采样点多,采样不准确的问题,论文首先计算出目标运动前后的近似仿射变换参数,然后利用该参数对采样方法进行改进,在采样点数目较少的同时取得了更好的跟踪效果。最后将所提出的算法与已有的前沿算法进行了严格的性能对比测试。