复杂场景下的目标检测技术研究—视觉模型方法

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:EAGLE1205
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂场景下的目标检测是一个极具挑战性的任务。一方面,光照在强度、角度、距离上的变化与观察者在观察位置、角度、距离上的变化带来背景与目标的各种复杂变化,比如亮度、对比度、阴影、位置、尺度、视角、姿态等变化;另一方面,3D到2D的成像过程中引入的噪声、造成的信息缺失使得问题更加复杂化甚至变得无法求解。  本文围绕复杂场景下的目标检测这一任务开展了系统性的研究工作,涉及到的内容包括:视觉研究的方法论基础,单帧上的2D目标检测(包括视觉词袋模型、Pictorial模型),连续帧上的2D目标检测(朴素贝叶斯模型)。本文的研究工作既注重理论与方法的思考,也注重算法设计与实现的研究。具体的内容简述如下:  1.本文在 Marr的视觉表示理论的基础上,结合统计学习理论,总结出了视觉模型方法,即视觉约束的统计学习方法。该方法具有两个重要特点:既注重计算的研究又注重物理约束的研究;强调视觉计算从本质上讲是一个概率推断过程。该方法将解决一个具体的视觉问题归纳为五个步骤,其中,前两个步骤对应计算理论层次,后三个步骤对应算法设计层次。该方法是贯穿本文的方法论基础,对本文研究工作的开展具有基础性的指导作用。  2.本文采用视觉模型方法,对具有仿生特点的分层最大化模型(HMAX)进行了计算理论层次与算法设计层次上的分析,指出其本质上就是视觉词袋模型。基于此分析,本文对分层最大化模型进行了两方面的发展:首先,针对该模型采用的随机视觉单词选取方式存在的误选、低效等问题,将自下而上的视觉注意力约束引入到视觉单词的选取过程中,有效提升了视觉单词选取的有效性与效率,从而有效提升了目标检测的性能;其次,针对视觉词袋模型缺乏对目标几何结构信息进行描述的问题,将分层最大化模型与显式的形状匹配模型结合起来,提出了可区分的形状模型。从计算理论层次上讲,可区分的形状模型引入了一种额外的约束——目标的形状约束。实验表明,目标的形状约束对于提升目标的检测性能是有效的。  3、本文采用视觉模型方法,对Pictorial模型与受约束的Pictorial模型进行了计算理论层次与算法设计层次上的分析。针对受约束Pictorial模型的一种设计——星形的形变部件模型(DPM),本文首先注意到了其采用的基于梯度原子原语的HOG特征仍有较大的提升空间,因此本文基于Gabor原子原语提出了一种具有仿生特点的底层特征HOGabor。在PASCAL VOC2007等数据集上的实验表明,该特征能够显著的提高刚性目标(如飞机、小车等)的检测性能。本文在多个数据集上对形变部件模型进行了全面的评估,并从统计学习理论的角度分析了样本、模型复杂度、模型推广能力之间的关系,对进一步的研究工作具有重要的指导意义。  4.针对受约束Pictorial模型的另一种设计——树形的姿态估计模型(POSE),本文指出了其存在的三方面问题:部件的联合分布问题,尺度估计问题和计算效率问题。针对这些问题,本文提出了计算目标最大后验概率(MAP)、基于根部件进行姿态搜索两种改进方案。实验表明,这两种改进方案能够有效提高人体姿态估计的性能与效率。  5.对于连续视觉输入,本文基于离线学习的目标先验与在线学习的目标偏置显著性似然,建立了一个实际的视觉贝叶斯模型。该模型采用特征条件独立假设,可以基于同样的底层特征——Gabor原子原语。该模型不同于已有的概念性的或者面向特定用途的视觉贝叶斯模型,很好的展现了在连续视觉输入上统计学习问题的有效简化,展现了自上而下与自下而上两个视觉过程的交互,展现了由粗到细的目标检测过程。  整体上看,本文首先总结了视觉研究的方法论基础:视觉模型方法;然后在其指导下主要对三类2D目标检测模型进行了系统性的、理论与实践并重的探讨;在此基础上,本文从多个层面、多个角度对这些2D目标检测模型进行了发展、提升、改进与再创造,一些工作已经具备了潜在的工程应用价值,另一些工作则在理论与方法层面具有一定的学术价值。从相互之间关系来看,这些2D目标检测模型在计算理论层次上存在由简单到复杂的递进关系,而在算法设计层次上则存在两个基本特点:输入由单帧走向连续帧、输出由粗(目标的矩形框)到细(目标的形状、目标的部件)。值得特别注意的是,本文已经得到了由粗到细的2D目标表示,这为走向分层的3D目标表示奠定了坚实的基础。
其他文献
近年来,网络技术与多媒体技术的飞速发展和广泛应用使得数字视频的产生、拷贝、传播和发布变得越来越容易,数字视频的版权保护问题日益凸现出来。尽管也出现了一些用于多媒体
进入21世纪之后,随着互联网的普及互联网技术获得了爆炸式的发展,传统的以太网架构渐渐不能满足爆炸式增长的数据流量与复杂网络拓扑的管理需求,一种更加先进、更加灵活的互
【摘要】 随着社会经济的日益发展,水泥混凝土路面因具有很大的刚性和良好的抗疲劳性能,得到了日益广泛的运用,但从道路的使用情况来看,效果并不理想。本文分析了公路水泥混凝土路面常见的质量问题及其原因,提出其质量控制的办法。  【关键词】 公路水泥混凝土路面;问题,质量控制  中图分类号: U416.216 文献标识码: A 文章编号:  引言  随着现代交通发展对路面质量提出了更高的要求,水泥混凝土路
期刊
随着网络技术的发展,家庭网络成为一个新的热点。同时,越来越多的电器在人们的家中使用,对它们的控制变得越来越复杂。如果把所有的电器连接起来组成一个网络,则可以通过控制
摘要:随着盾构施工技术的不断发展,自动测量系统因其可降低测量人员作业强度、测量时不影响正常施工、提高施工质量等优越性而得到了越来越广泛地应用。可自动测量系统一旦出现错误了该怎么办呢?这时就显示出了人工测量的必要性。本文简要介绍了自动测量系统的组成与工作原理,并结合天津市地铁3号线14C标段津围公路站~宜兴埠站盾构区间简述了自动测量系统与人工测量相结合的方法指导盾构掘进在实践中的应用。  关键词:盾
期刊
移动Ad hoc网络组网灵活方便、设施投资少,不受固定拓扑结构限制,在战术互联、应急救灾、临时集会等环境,具有很高应用价值。移动Ad hoc网络具有无线传输的介质、动态改变的
摘要:房建工程中混凝土工程的体量日渐增大。同时,随着我国建筑技术的发展和城市建设及环保的需要,在混凝土施工中,如何有效防止和控制混凝土变形裂缝的出现和开展,显得非常重要。本文通过对混凝土工程的简单介绍、房建工程中控制混凝土裂缝施工技术的应用原理及施工技术应用的设计的阐述,联系实际操作,综合监控分析房建工程中控制裂缝施工技术的应用要点。  关键词:成因分析 控制 混凝土裂缝技术   中图分类号:TU
期刊
【摘要】近些年,建筑工程质量事故的频繁发生越来越引起了人们的重视,严格控制建筑工程质量尤为重要。论文阐述了建筑出现质量事故的主要原因及处理对策,以防止质量事故恶化、排除工程上存在的隐患、预防事故的再次发生、减少损失。  【关键字】建筑工程,质量事故,安全事故,原因分析,防止措施  中图分类号:TU761文献标识码: A 文章编号:  一.前言  质量安全是整个工程管理系统的基础。在对一个项目施工时
期刊
跳频技术具有很强的抗干扰、抗噪声和抗频率选择性衰减的能力,较低的误码率以及多用户功能,对于利用电力线这个受干扰严重、衰减大的信道进行数据传输有很好的适应性。本文重点研究自适应跳频技术在电力线通信中的应用。首先,深入探讨了配电网电力线的阻抗特性、衰减特性、噪声特性和干扰特性,并且针对电力线的信道特征,提出了若干通信系统设计策略。继而深入研究了跳频技术的原理、特点、优势、实现方法。并利用MATLAB仿
人脸识别是一项富有理论基础和应用价值的研究课题。典型的人脸识别系统包括:人脸检测、特征提取(预处理和特征提取)、人脸识别三部分。在自动人脸识别中预处理和特征提取占有