复杂场景下的视觉对象跟踪建模及算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:afei137
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对象跟踪是一个计算器视觉领域内的基本任务,该任务旨在从图像或者视频中寻找出目标物体。该任务在自动驾驶、智能监控、人机交互以及医学成像等多种运用中具有很高的实用价值,因此大量的研究力量被投入其中。然而,在真实的对象跟踪场景中,视频目标跟踪往往会由于复杂场景条件和目标运动的随机性而变得困难。在自然条件下,目标物体经常出现光照变化、旋转、伸缩、遮挡、曝光不足、背景变化、运动的复杂性和随机性等因素,这些都会使得对象跟踪变得非常困难。虽然对象跟踪算法已经取得了丰硕的研究成果,但在理论和应用上也存在着不完善和待解决的问题。在此背景下,研究复杂场景下的对象跟踪算法在理论和应用方面都具有非常重要的意义。从神经网络的模型结构出发,对现有的模型进行优化,结合真实对象跟踪场景特性,探索新的网络模型,研究新的处理算法,提高对象跟踪的性能和效率。研究成果主要在如下几个方面体现:
  首先,针对复杂场景下的跟踪失效及恢复问题,提出了一种基于自组织映射网络(Self-Organizing Maps,SOM)和相关滤波器的长期记忆对象跟踪算法。在对象跟踪中,不同的视频或图像中的同一种物体常常有着不同的外观,对这些外观进行学习成为有效跟踪的关键,本算法使用具有人脑神经元的信号处理机制特点的SOM,以自适应、无监督的方式进行特征提取。同时提出了同时学习多个自适应相关滤波器来进行跟踪目标的方法,这些滤波器采样不同的更新策略,协同地进行跟踪。在大规模的基准数据集上进行的大量实验结果表明,提出的对象跟踪算法能有效地解决复杂场景中出现的严重遮挡、目标丢失、尺度变化等跟踪难题。
  其次,针对复杂场景下传统手工特征模型的局限导致对象跟踪的准确度问题,算法提出利用深度卷积神经网络层次特征结合相关滤波进行对象跟踪算法。在深度神经网中,前端网络层具有更多的图像纹理信息,有较高的分辨率,能够对跟踪对象进行精准的定位;而后端网络层保留了更多的图像语义信息,适合对目标形变进行检测。算法利用高层的抽象信息对目标进行粗略定位,再利用浅层的纹理细节进行精细定位,最后进行加权融合得到跟踪目标的位置。提出的自适应加权特征融合的跟踪算法结合了深度学习分层特征和相关滤波器的优势,在当前大型对象跟踪测试集上取得了很好的结果。
  再次,针对复杂场景下多目标跟踪的严重遮挡、尺度变化等问题,提出了一种连续两帧输入的可变形卷积层和可变形池化层的卷积神经网络用于多目标跟踪。算法在传统卷积神经网络基础上增加了可变形卷积层和可变形池化层,在卷积层和池化层中利用额外的偏移量来修改采样的位置,根据跟踪对象的实际形状进行采样。同时,算法建立了目标对象的关联轨迹,有效解决了跟踪漂移和跟踪丢失的问题。
  综上所述,针对对象跟踪算法的几个关键问题进行了深入的研究。对于跟踪鲁棒性及性能问题,提出利用SOM网络进行特征提取与降维,结合跟踪记忆器设计算法;对于传统手工特征模型的局限和跟踪准确度问题,提出将深度网络层特征和相关滤波器相结合的跟踪算法;此外,讨论了利用可变形卷积神经网络解决形变对象的多目标跟踪问题。提出了三种不同原创性算法,侧重于解决视觉对象跟踪算法常见的不同层面问题。大量实验结果和理论分析表明,提出的一系列视觉跟踪算法运行稳定,性能高效,显著提升了视觉对象跟踪算法的鲁棒性。
其他文献
近年来,随着互联网技术和在线社交网络的发展,人们可以随时随地创作、浏览、转发、评论各种信息,在个人创作和消费信息的同时提高了信息在时空传播的效率。与广播、电视、报纸等大众传媒相比,在线社交网络从根本上改变了信息传播的方式和机理,逐渐成为信息发布和传播的主流平台。社交网络信息传播的相关研究,不但能够帮助人们认识社交网络本身,解释网络群体行为规律,预测信息传播趋势,而且在公共舆论导控、精准市场营销、信
学位
运动目标行为分析是无人车研究的难点问题,本文着眼于提高无人车复杂环境下的场景理解能力,以相关性表示为切入点,开展运动目标行为分析方法研究。论文的主要研究成果和创新点如下:  1.提出一种基于时空显著性的级联相关滤波算法。该算法深入研究序贯图像中的目标行为特性,利用相关滤波方法对目标行为特征进行在线建模,并针对相关滤波算法固有的边缘效应问题,研究多层次特征的级联表示,利用高层次特征表示整体语义,提升
学位
高质量的预测结果对人们的生产生活具有重要的指导意义,有利于人们制定出更可靠的决策方案。预测是根据事物过去发展的现律,估计其未来发展趋势的一种理论。近十几年,各领域专家学者提出了数以万计的预测方法,预测学科得到了突飞猛进的发展。随着大数据时代的到来,挖掘海量非结构化和半结构化数据中蕴含的信息对预测方法提出了新的挑战。同时,如何提高预测方法在特定领域的精度成为了一个预测研究的重要研究方向。深度信念网络
学位
复杂任务往往需要异构多智能体合作才能完成,而联盟是实现合作的重要方法之一。同时,在分布式系统中,通信是多智能体合作执行任务的前提。因此,在同时承担通信和任务执行的条件下,智能体如何合理有效地组建联盟是提高多智能体系统应对复杂任务的关键之一。然而,适合于通信的联盟结构(Coalition Structure,CS)不一定适合于合作完成任务,适合于合作完成任务的联盟结构也不一定能满足通信的要求;因此,
学位
由于决策与人的思维和认识有着密切的关系,决定了决策科学是一个十分复杂的系统科学。在许多现实的决策过程中,由于决策问题自身的复杂性、不确定性和人类思维、认识的模糊性及参与决策的专家个人偏好等不确定性,形成了一类包含语言值数据的不确定决策问题,这类含有语言信息的决策问题一直是决策科学研究的一个难点。  Zadeh教授于上个世纪六十年代建立的模糊集理论,为人们处理模糊的语言信息提供了有力的工具。但是,在
该文所做的工作主要就是围绕其中的图像特征和高维索引展开的.图像特征的重要性在于它是图像检索的基础,一个好的图像检索系统必须能够提取出最能描述图像内容的特征来,否则后面的相似性检索就无从谈起.在诸多特征中,色彩特征是最为常用的一种.它不仅有良好的视觉特性,在复杂背景下有较强的鲁棒性,而且对图像尺寸和拍摄视角等具有相对的独立性.所以也是被使用最广的.目前对于色彩特征的研究,已经从早期的直方图发展到了结
学位
交通流量预测是指通过历史交通数据估计在未来某一时段某一指定区域通过的车辆数量。交通流量预测是智能交通系统的一个重要组成部分,其预测精度对于交通控制系统的有效实现具有重要的意义。虽然交通流量预测问题已研究长达数十年,但是现有的预测方法仍然存在一些不足。这些不足主要表现在:浅层模型难以揭示交通流量数据的内在时空关系;许多方法将特征学习和回归预测分离,使得模型性能下降;手工提取特征不能适应问题的复杂性;
科学技术的发展,尤其是智能移动互联和物联网相关技术的普及,影响了数据的维度、大小、种类以及产生方式,增加了数据的复杂度,从而使数据的标注愈加困难。所以,如何在类标未知的样本中解决模式识别的相关问题成了无监督学习应用的背景。在无监督学习中,聚类和异常检测是两类广泛使用的方法。  早在《战国策.齐策三》中,我们的先人就提出了“物以类聚,人以群分”的思想。近年来,密度代表点这一概念被广泛应用于聚类分析领
学位
随着社会的快速发展,模式识别已在各行各业受到了广泛地关注,并已成为当今社会生活中的实际应用。模式识别研究内容包括了数学、机器学习、计算机视觉、人工智能、神经科学以及认知科学等多门学科,是一个具有挑战性的理论研究难点,也是一个快速发展的挑战性应用问题。作为模式识别的核心内容,特征提取主要研究如何从高维观测数据中学习到有利于识别任务的判别属性,特征提取模型的质量直接决定着模式识别的性能。特征提取研究是
学位
压缩感知是一种新型的信号采样模型,能够通过设置欠定线性系统来有效地捕获和恢复信号。通过利用自然界的信号通常是稀疏或可压缩的特性,压缩感知理论表明通过少部分线性、非自适应的测量值可以高概率地重构信号。在这种新颖的信号采样模型中,压缩过程直接被融入到采样过程中。因此,由于其固有的特征,自提出以来,压缩感知在诸多领域引起了高度关注。  由压缩感知的采样系统可知,投射到随机子空间的测量值可以被视为信息保护
学位