基于改进的Mask R-CNN的车辆识别及检测

来源 :安徽大学 | 被引量 : 0次 | 上传用户:nimadehundan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着汽车行业的迅速发展,交通事故处理逐渐成为交管部门的一项挑战性工作。为进一步提高交通事故处置效率,在静态图像中对事故车辆完成识别和检测任务是文本研究的主要内容。传统的车辆图像识别算法将特征提取与目标分类常分为两个阶段,特征选取需要人工构建,主要依靠人为经验,整个过程效率低下,特别在现实复杂的交通场景中,由于天气、光照、环境以及光学抖动等因素的影响,不能够有效检测出目标。针对传统车辆检测算法的不足,卷积神经网络的兴起逐渐成为主流的目标检测算法,其主要优势在于目标检测中候选区域生成、特征提取、分类、位置精修四个步骤被统一到一个深度网络框架之内,有效提升了检测效率,并且针对目标旋转、位移具有一定的不变性,可适用于复杂场景。本文研究参考前沿的卷积神经网络知识,并将其应用于静态图像中的事故车辆检测,主要完成以下工作:1)研究了卷积神经网络在目标检测时的结构及工作原理,并对目前目标检测领域具有代表性的神经网络R-CNN、SSPNet、Fast R-CNN、Faster R-CNN、Mask R-CNN算法分别进行研究,通过对每一种网络结构的研究对比,可直观了解每一种网络的构建原理,进而更清晰认识Mask R-CNN的网络结构在目标检测中的优势。2)结合事故现场中车辆检测问题,本文在原Mask R-CNN网络模型基础上通过对网络结构及部分细节进行改进,从而更好地适应于实际应用问题,实现该网络的应用价值。由于车辆检测可以近似看成一个二分类问题,所以在特征提取网络结构上通过减少网络层数的方式,剔除在特征提取中产生的冗余特征信息,提高算法运行速度,实验结果证明当网络层数减少8层时,算法达到最佳效果。在设计候选窗口分类器时,为了防止过拟合,本文将dropout层的阈值设置为0.5,同时在候选窗口位置增加了池化层。在候选框生成时,将非极大值抑制算法改进为学习网络,使得模型可以更加灵活选取极大值,摆脱人为经验对于模型的影响,提高模型的泛化能力。3)结合研究背景,本文首先通过ImageNet以及PASCAL VOC车辆图像对模型进行了初步训练。为了使模型更加适应事故图像中车辆识别和检测问题,本文建立了两类数据集,第一类是事故车辆数据集,第二类是航拍车辆数据集。由于在公开数据集中事故车辆的数据集相对较少,为了扩展数据集,本文采取数据增强的方式进一步提高模型的泛化能力。
其他文献
本文分析了大伙房水库主溢洪道历次泄洪与消能情况,分析了"95.7"洪水溢洪道的破坏情况及破坏原因,提出了修复意见,可供类似工程参考.
本期“编读”中陆宗成先生的文章,年前就已收下,出于各种原因一直拖到第4期才发出来。看到这样的读者,读到这样的文章,任何一位编辑都会由衷感到喜悦的。我相信,正是陆先生这
期刊
按语:咸安宫官学,原系雍正年间为教育内府子弟而设,后亦于八旗子弟中选俊秀者入学,是旗人进入官吏体系的培训机构和重要途径。咸安宫官学的兴衰变革,反映了清廷选拔人材标准
针对南方CASS数字化地形地籍成图软件的编码规则及应用上的不便,在对不同野外数字化测图方法优缺点进行分析的基础上,提出一种更方便、快捷的首字母简拼自编码法。试验表明,
滔滔黄河从古至今演绎出多少传奇故事,培育了无数风流人物。1955年2月,张新纪出生在位于黄河滩区的长垣县苗寨乡东旧城村。1974年,张新纪初中毕业后,因家贫而辍学。迫于生计,1980
埃及,一个充满神秘和诱惑的国度,一条尼罗河流淌着埃及千年的文明。第一次接触古埃及首饰就被它深深地吸引了,每一个手镯、戒指、项圈都仿佛在述说一段传奇的历史。情迷古埃
大学的核心竞争力既包括学者、学术、学科等硬核心竞争力,又包括管理和文化等软核心竞争力。以美国密歇根大学的基本概况为切入点,对这所大学的核心竞争力进行了解析,并阐述
介绍了结构地震反应分析的振型分解反应谱法和动力时程分析法,对2种分析方法的原理、特点及应用进行了对比研究,得到了一系列有益的结论.通过实例分析进一步验证了2种分析方
刚刚过去的2011年是“十二五”开局之年,按照安徽省委省政府的总体部署,全省自主创新工作以强化支撑发展为中心环节。以推进合芜蚌自主创新综合试验区和国家技术创新工程试点省