稳健视觉跟踪算法中的关键问题研究

来源 :上海交通大学 | 被引量 : 14次 | 上传用户:wxwp_xu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉跟踪是当前计算机视觉领域中一个热点研究主题,在智能视频监控、机器人导航、智能交通以及国防安全等领域都有重要的应用。为了满足实际需要,当前的视觉跟踪方法需要处理很多实际问题:如何建立有效的表观模型,在合理地描述目标的同时也能较好地区分背景;如何选取快速高效的跟踪推理算法以满足实时性要求;如何在多目标跟踪时正确关联目标等等。为了解决这些问题,视觉跟踪需要涉及多个理论学科,包括:图像处理、模式识别、概率论与数理统计、最优化理论以及控制理论等。因此视觉跟踪是一个兼具理论价值和实际意义的研究主题。视觉跟踪方法可大致分为两类:确定性跟踪方法和概率跟踪方法。确定性跟踪方法往往先根据目标的视觉特性,建立度量目标和候选目标的相似度的最优函数,进而采用最优化算法迭代地计算目标状态(如位置、大小和方向等)的局部最优值。此类方法具有计算效率高和所依赖的参数较少的优点,但由于容易陷入局部极值而导致跟踪失败。概率跟踪方法首先预测目标的状态,再通过视觉观测模型结合概率方法进行推理来更新目标的状态。目前比较流行的概率跟踪方法是粒子滤波,其优点是能够处理非线性非高斯系统、跟踪稳健,但计算效率较低,并且对参数依赖较多。为了改进确定性跟踪算法,需要做的工作包括:如何建立合理的目标模型及其相似性度量方法,以及如何理论推导基于相似度模型的最优化方法。基于此,本文提出以下创新:1.针对基本的mean shift跟踪算法由于无法融入目标的空间信息从而造成目标跟踪的不够精确以及无法处理目标被部分遮挡的问题,采用多个图像子块描述目标,给出了目标与候选目标的相似性度量函数,并基于此推导了类mean shift迭代算法。通过真实实验序列证明,算法能够对目标的尺寸和位置给出较为精确的跟踪结果,并能够较好地处理部分遮挡问题。2.提出了“微分结构相似度”跟踪方法。该方法以结构相似度为相似性度量函数,基于此推导其关于目标状态(位置和尺寸)的梯度,并基于最速下降法的最优化方法给出合理的跟踪方法。算法的跟踪结果精确,能够有效地处理目标的尺寸变化,并且能够在光照发生变化时仍然能够准确地跟踪目标。对于基于粒子滤波的跟踪算法,如何提高采样效率和如何解决多目标跟踪发生遮挡时的推理策略是两个重要的问题,本文针对这两个问题所作的创新有:1.提出粒子滤波框架下基于两层表观模型的跟踪算法。采用颜色/灰度直方图作为“粗糙”模型,应用mean shift算法将每个粒子移位到局部最优位置;采用本征空间模型作为“精确”模型,用来计算每个粒子的权重,以估计目标最终状态。算法克服了粒子滤波跟踪时粒子集中的无效粒子过多,采用较少的粒子数,并同时融合了颜色/灰度特征与目标的本征空间模型,在处理旋转、变光照、变姿态等问题上有较好的效果。2.针对前视红外成像的特点,提出基于显著性检测和两步采样的红外目标跟踪算法。在红外前视图像中,要跟踪的目标往往在图像中都是“显著”的,基于此,本文先在显著性检测的结果上建立显著性观测模型,再将本征空间模型作为另一个观测模型,两个模型通过两步采样算法进行结合。该算法跟踪结果准确,能够处理红外跟踪时目标外观变化,以及由于传感器自运动造成的目标位置突变等问题。3.针对多目标跟踪问题,采用马尔可夫随机场建立概率图模型,在均值场蒙特卡罗方法的基础上,提出基于核密度估计的均值场蒙特卡罗方法。多目标跟踪时,相似目标之间的遮挡会造成跟踪器关联错误,均值场蒙特卡罗方法通过目标之间的限制关系,结合均值场推理方法可以很好地解决关联问题。但算法由于建议分布的不准确,会造成大量粒子无效,为此通过结合基于mean shift的核密度估计方法,能够很好地改善这个问题。该算法在红外序列以及头部跟踪中得到了成功的应用。
其他文献
为了使电子政务领域的公文检索更好地为决策支持服务,本文提出了一种基于本体的智能检索方法,通过语义相似度和相关度的计算,并利用语义推理实现了相关信息的语义融合,增强了公文
目的:探讨子宫脱垂的临床治疗情况及其严重程度的危险因素。方法:收集了我院2011年9月至2014年1月期间收治的120例诊断为子宫脱垂的患者的临床资料,并对其子宫脱垂程度、相关
中国老龄化背景下,老年人养老问题越来越受到社会的广泛关注。传统的家庭养老方式在现代社会面临着挑战,机构养老也未能满足大多数老年群体的需求。自2001年居家养老在中国实
市政道路是我国道路交通重要的组成部分,其对城市的发展具有较大的积极意义.在市政道路的施工过程中,路基的施工是整个工程的基础,其必须按照施工关键程序来完成,并且在质量
《数据库原理与应用(sqlserver)》课程具有高理论性和实践性,为了提高本课程的教学质量,结合本学院非计算机专业选修课的课程性质,引入一系列教学方法来优化理论课堂和实验课堂的
目的:比较颅脑外伤术后患者实施早期、个体化、程序化的综合性康复治疗、护理与神经外科术后常规治疗、护理的效果。方法:将90例重型颅脑损伤患者随机分为试验组(45例)和对照组(45
随着互联网信息技术的飞速发展,传媒行业也进入了新媒体时代。当前,在高速的无线宽带网络、数字化的摄影技术等的支持下,新媒体呈现出井喷式的发展。如今,得益于数字化的摄影
多胎妊娠一般以双胎为主,三胎妊娠少见,特别是自然受孕三胎妊娠更少见。多胎妊娠母婴并发症较多,如为瘢痕子宫合并多胎妊娠,妊娠期及分娩期母婴并发症如早产、子宫破裂等机会