基于深度学习的车型识别

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:zbtoy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
车型识别(Vehicle Type Recognition,VTR)是让计算机根据机动车型号对机动车分类的技术,在许多实际应用中占据着最基础的一环,例如智能交通、监控追踪和无人驾驶等。根据分类的粒度,车型识别可分为基于整体外观的粗粒度车型识别和基于局部细节的细粒度车型识别,它们一般独立应用于不同的场景中。车型识别已经有了二十多年的研究历史,然而无论对于粗粒度车型识别还是细粒度车型识别来说,任意拍摄视角下的识别准确率仍不令人满意。同一辆机动车在不同的视角下有不同的平面外观,这些外观的差异性很大,提升了车型识别的难度。在粗粒度层面,多视角问题一直未得到深入研究;在细粒度层面,已有研究虽然考虑了多视角因素的影响,但是车型识别的准确率不高。基于已有研究的不足,本文总结了两个关于车型识别的工作重点:1.在粗粒度车型识别中解决多视角因素的影响;2.提升细粒度车型识别的准确率。围绕上述两个重点,本文开展了以下工作:1.创建粗粒度的多视角车型识别(Multi-View Vehicle Type Recognition,MVVTR)数据集。已有的粗粒度车型识别数据集都是为基于特征提取或几何估计的方法服务的。这些方法都只考虑了有限视角下的情况,因而无法在这些数据集上研究拍摄视角对车型识别的影响,只能创建新的车型数据集。利用网络爬虫技术,我们从互联网上搜集了七种车型的多视角照片。这些照片的拍摄视角既有正面和背面,也有侧面和斜侧面。2.设计反馈增强的多分支卷积神经网络(Feedback-enhanced Multi-branch Convolutional Neural Network,FM-CNN)。本文首先针对车型识别问题训练或微调了已有的神经网络,结果性能很差,神经网络无法学到有用的特征。考虑到诸如SIFT和HOG等传统图像描述子中将多尺度特征整合的方法,本文对已有神经网络做出改进,将卷积部分扩展成多个分支,分别接受不同尺度的输入。为了减轻在训练过程中不同分支之间的相互干扰,本文又为每一个卷积分支增加了一个局部分类模块,增强每一个分支从分类结果得到的反馈。3.微调FM-CNN的高层卷积层,避免过拟合。本文使用的粗粒度和细粒度车型识别数据集都是小数据集。从训练或微调已有神经网络的结果推断,用这些小数据集训练或微调FM-CNN里的所有参数会造成过拟合。考虑到卷积神经网络里面不同卷积层学习到的特征跟人脑视觉神经元响应的特征具有相似的语义层次性,本文假设神经网络浅层卷积层学习到的低语义特征对于不同的任务具有普适性,而高层卷积层学习到的高语义特征才具有任务特异性。所以,本文让FM-CNN复用已有神经网络的权重作为初始化,只微调高层卷积层和全连接层的权重,减少需要更新的参数量,降低过拟合的风险。通过上述三点工作,本文的FM-CNN在粗粒度和细粒度车型识别上都超过了已有方法:在粗粒度车型识别上达到了 94.9%Top-1准确率;在细粒度车型识别上达到了 91.0%Top-1和97.8%Top-5准确率。
其他文献
夹竹桃天蛾在汕头一年发生3代,以蛹越冬。越冬代成虫于2月下旬开始羽化,第1代幼虫于3月上旬开始孵化,以5-6月、8-9月为幼虫取食高峰期。本文报道其生物学特性,并提出防治建议。
主要对X射线、γ射线及中子辐射屏蔽材料的种类、基质材料和屏蔽性能进行了全面的分析和综述。在此基础上,探讨了现有射线及中子辐射屏蔽材料存在的主要问题,如吸收效果不高
随着农村城镇化进程的加快,农村集体土地使用权如何进行流转也逐渐成为亟待解决的问题。本文将着力对集体土地使用权中的集体建设用地使用权流转方面的有关问题梳理,并提出一些
采用新型烯类硅氧烷单体对家蚕丝接枝改性.探讨了不同条件对接枝的影响及接枝后家蚕丝的各项性能.结果表明,接枝后真丝织物的折皱回复性显著提高,手感更为柔软,且不影响家蚕
摘 要:微媒体渗透到高校学生的生活方式之中,对传统高校学生党建工作带来极大的挑战,本文基于高校大学生“微党建”工作创新的角度,从微信、微博、微视频等微媒体入手,探讨高校大学生“微党建”工作的创新举措,分析高校大学生“微党建”工作的创新路径和方法,较好地提升微媒体时代高校大学生党建工作的针对性和实效性。  关键词:高校 大学生 “微党建” 工作创新  随着微时代网络新兴微媒体的不断渗透,高校大学生党
为了比较静脉留置针采血和常规静脉穿刺采血进行口服葡萄糖耐量试验(OGTT)的效果,从而探索一种便捷、科学的采血方法。对采用静脉留置针采血和常规采血的志愿者的血样进行OGT