【摘 要】
:
目标跟踪是计算机视觉领域中一个重要且富有挑战性的研究课题,它通过对视频中特定目标的定位与跟踪,为进一步的行为识别分析提供支持。目标跟踪算法涉及领域极广,是机器学习
论文部分内容阅读
目标跟踪是计算机视觉领域中一个重要且富有挑战性的研究课题,它通过对视频中特定目标的定位与跟踪,为进一步的行为识别分析提供支持。目标跟踪算法涉及领域极广,是机器学习、图像处理、模式识别和计算机技术等学科的结合产物。近些年来,随着计算机技术和现代传感器技术的快速发展,目标跟踪技术在视频监控、智能交通、人机交互、行为分析、医疗诊断、军事制导等行业有着良好的应用前景,同时也吸引了大量的科研人员从事这一领域的研究工作。尽管目标跟踪算法的研究工作在过去几十年里已经取得了较大的进展,但是由于跟踪场景中光照强度变化、目标尺度姿态变化、遮挡、快速运动模糊和背景杂乱等多种挑战因素的存在,开发出一种既能精准稳定地跟踪目标又有较高实时性能的目标跟踪算法仍然十分困难。本文是针对目标跟踪领域目前所存在的问题,所做的关于基于检测的单目标跟踪领域的研究工作。文章首先介绍了研究背景、领域的发展历史以及领域内几种比较经典主流的算法,经过大量的分析对比之后,创新性地提出了两种鲁棒性较好的算法。通过大量的实验分析论证,并与多个比较前沿的跟踪算法从多个方面进行了对比分析,从而突出了本文所提出的算法的优越性。本文的主要研究内容和创新点如下总结如下:1、基于局部线性约束的算法采用LLC编码方式来编码图像局部块,构建目标的局部表征字典,相较于稀疏编码方式,LLC编码不仅有解析解而且能够保证解的局部性,而对图像块进行编码能够克服部分遮挡的问题;此外,为了得到更加鲁棒的特征表征,算法采用多尺度的空域金字塔方式来进一步处理编码系数,而最终的特征向量不仅能够表征图像的局部信息,而且也能够捕获图像的全局信息,这无疑能够提高特征区分于背景的能力;最后算法利用基于图的流形学习算法来对所有候选样本进行排序,从而选择最优的目标候选。综上,该算法创新性地提出了一种有效的特征构建方式,并基于此利用流形学习的方式来挖掘目标潜在的流形结构,从而更准确地选择最佳候选。2、基于核相关滤波器的Boosting算法是基于近些年来比较火的核相关滤波器算法的改进。该算法通过多核Boosting的方式将多种不同核或者不同特征的滤波器融合到一起,从而得到更加鲁棒的强滤波器,以更为准确地确定目标最佳响应点,也即目标的中心。此外,原本的核相关滤波器并没有解决目标的尺度估计问题,这里利用增量PCA算法来学习目标的低维表征,并通过采样目标尺度来估计最佳的目标尺度。
其他文献
场景深度数据的获取是计算机视觉领域的经典问题,数字投影条纹测量技术由于其非接触、高精度、计算快速等显著优点,成为深度估计领域持续的研究和应用热点。传统的数字投影条纹深度获取系统常使用CCD/CMOS相机作为采集设备,但在高动态表面物体、大景深物体的深度数据获取和空间分辨率提升等方面存在局限性。随着光场成像技术的发展,结合光场相机和数字投影条纹成为一种新的深度估计方案,有可能有效解决以上问题。但以光
创新型城市是国家创新体系的重要组成部分,在创新型城市建设过程中,政府发挥着不可忽视的推动作用。对于创新型城市政策绩效的评估,能够判断政府政策的有效性,为制定科学合理
随着物联网相关技术的不断发展,以计算机和通讯设备为主题的信息产业正逐渐吸引着研究人员的关注。与此同时,在集成了多种传感器模块后,智能手机、智能手环、智能手表等智能
中亚造山带东南端的南蒙古-二连地区以广泛发育晚古生代火山岩为特色,前人对该地区火山岩进行了较深入研究,但更多的集中在中国境内,而对中蒙边境特别是蒙古境内的火山岩研究较弱,从而限制了对这些地区晚古生代火山岩,特别二叠纪火山岩的整体认识。本文以南蒙古Hatanbulag地区和内蒙边境二连西额仁淖尔地区的代表性火山岩为研究对象,开展了详细的岩相学、锆石U-Pb年代学、岩石地球化学和锆石Hf同位素研究,探
本文在对其它文献进行研究整理的基础上,分析了新媒体时代高校思想政治教育面临的一系列问题,包括高校思想政治工作面临挑战、高校思想政治教育者地位被弱化、大学生受到不利
随着物联网的快速发展,智能交通系统(Intelligent Traffic System,ITS)以及V2V技术得到了广泛应用,以此为基础提出的机会网络(Opportunistic Networks,ONs)使在稀疏环境下的通信成为可能,使用户之间的通信变得更加便捷。相比于传统TCP/IP网络,ONs对网络环境的要求不高,甚至不需要消息源与目的间建立完整的通信链路,它可以通过节点的位置变化创造相遇
为了适应移动设备的快速发展带来的数据需求的大幅增长,WiFi被应用于许多公共场所中,呈现出超密集,大容量和实时服务的特点。由于AP和用户的超密集性,同信道干扰和AP间负载不
视频物体检测,即对视频中每一帧上出现的物体进行定位和分类,是计算机视觉中一个基础的问题之一。在现实生活中,它具有广泛的应用场景,如自动驾驶、视频监控、智慧城市等。近年来,基于特征聚合的视频物体检测算法主要依赖于推断特征的一致性。像素或者示例层次特征的一致性估计是一个很困难的问题,因为视频中常出现图像质量退化现象,如:运动模糊、视频失焦、物体遮挡等,这使得特征一致性估计的结果不稳定。此外在实际应用场
经过第八届中法跨文化研讨会的同声传译实践,笔者发现影响自身翻译质量的最大因素是“理解”,而口译中的“理解”是一个复杂的认知过程。释意派原理、丹尼尔·吉尔的精力分配模型等口译理论中都有“理解”的参与。理解的重要性可见一斑。本论文将借助释意派原理、精力分配模式、认知心理学和心理语言学,通过分析第八届中法跨文化研讨会的语料,分析造成译员理解障碍的原因,如发音、时态、生词、信息密度等语言因素,以及精力分配
责任意识是指个体清楚的知道什么是责任,并自觉、认真地履行社会所要求的责任以及自己所承担的角色责任,最终把责任转化到行动中去的心理特征。道德与法治课作为一门帮助初中生培养道德品质和行为习惯的重要学科,对初中生责任意识的树立具有重要作用。因此,在道德与法治课中强调培养学生的责任意识是十分必要的。培养学生的责任意识有利于实现做负责任公民的课程目标,有利于落实课堂教学的实效性,有利于学生知情意行统的统一。