基于优化Mask R-CNN的城市道路车辆检测

来源 :东华大学 | 被引量 : 0次 | 上传用户:aulanb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
速度快、准确度高的车辆检测系统不仅能够帮助交通指挥员加强对道路交通系统的管理,而且能够在交通事故等紧急事件中快速提取出事故车辆的信息,提高处理紧急事件的效率。可见,提高车辆检测的精度和速度对增强城市道路交通管理系统具有重要意义和应用价值。本文深入研究了Mask R-CNN网络模型,对其主干网络和Ro I Align进行改进,提出了CA-PS Mask R-CNN网络模型,完成以城市道路为实际背景的不同车辆类型(car、bus、truck)检测任务。主要改进如下:(1)提出新的骨干网络Res Net59-FPN-CA:首先在Res Net50的基础上新增一个第六阶段用来提取FPN中的特征图P6,五、六阶段输出的特征图的尺寸分别是输入图像的1/16和1/32,并且其残差结构用空洞卷积残差结构代替,不仅能够增大深层特征的感受野和分辨率,还能够获得更准确的定位信息,同时将五、六阶段输出的特征图的通道数减少为256,减少网络参数的数量和网络模型的运行时间;其次在FPN网络中引入通道注意力机制(CANet),实现逐通道调整特征图,提高特征图中重要特征的辨别能力,使得后续的RPN网络可以更充分的利用这些特征图。(2)随着骨干网络Res Net层数的增多,Mask R-CNN网络模型在定位任务中对目标位置信息的感知能力下降。针对此问题,本文引入588维的位置敏感得分图来提高深层特征对目标位置信息的敏感度,并使用PS Ro I Align进行池化得到7*7*12和14*14*3的候选区域,减少Head结构的通道数,提高模型的检测速度。在CityScapes数据集上对基于不同主干网络的Mask R-CNN网络模型、基于不同维度的位置敏感得分图的Mask R-CNN网络模型以及CA-PS Mask R-CNN网络模型分别进行训练。结果表明,本文提出的基于Res Net59-FPN-CA的Mask R-CNN网络模型的检测精度明显高于基于其他主干网络的模型,基于588维位置敏感得分图的Mask R-CNN网络模型在基于不同维度位置敏感得分图的网络模型中具有更好的检测性能,CA-PS Mask R-CNN网络模型的检测精度提高为87.76%,测试时间缩短为128ms。
其他文献
随着在线社交网络的发展,社交平台下的用户群体也日渐壮大。新浪微博平台注册用户接近四亿,活跃用户超过一亿,是目前国内最大的微型博客社交平台。用户可以发布微博来分享信息,其它用户也可以通过评论或转发来对信息做出反馈。庞大的用户群体使得在新浪微博平台上有诸多类似于广告营销的应用。如何将微博下的社交网络特点利用起来,高效地进行广告营销,是一个很有研究价值的问题。构建社交平台上的用户影响力传播模型,利用用户
在线评测(Online Judge,OJ)系统为编程用户提供自主练习的平台,而OJ系统中大量的题目造成编程用户的选题困扰,因此在OJ系统中添加题目推荐模块对于编程用户而言具有重要作用,可以辅助他们进行题目的选择,节省选题时间。本文首先根据学生做题通过率进行题目推荐,通过率高的题目学生容易做对,能增加其做题兴趣,所以算法的目的是给学生推荐通过率高的题目。算法使用深度知识追踪(Deep Knowled
编织物编织成型后,具有良好的力学性能,所以在我国航空航天领域有非常多的应用。同时编织物力学性能受多方面因素影响,其中编织角和跳纱都是影响编织物力学性能的关键。而在实际编织机工作过程中,对于编织物上的编织角、跳纱的检测依然停留在人工检测阶段,容易出现错检、漏检的现象,效率极低。本课题针对立体编织物加在加工生产时对编织物检测的自动化程度不高的问题,设计了一个基于机器视觉的立体编织物实时检测系统。该检测
连城地瓜干是连城县传统的地方特色产品,位居"闽西八大干"之首,已有300多年的历史,早在清代,连城红心地瓜干已成为"贡品",取名为"金薯片"。连城地瓜干色泽鲜亮,香气纯正,口感甘醇、柔软细腻、有韧性。连城县地处福建省西部山区武夷山脉南段,属中亚热带气候区,雨水及光照充足,有效积温长,
期刊
随着信息科学技术的迅猛发展和互联网的普及,各种社交软件和电商平台的数据库存储着上百亿幅图像。在海量图像数据面前,传统的基于文本的图像检索系统存在着人工标注效率低以及受主观影响较大等缺点,已经不能满足人们日常对于图像检索的需求。基于内容的图像检索系统(Content-Based Image Retrieval)是使用图像的可视化特征对图像进行检索。图像检索提取的特征需要能够准确地表述自身所包含的语义
深度神经网络的运算通常都依赖于高性能的显卡,大容量的存储,优良的散热系统等,这些设备的高昂成本严重制约了其进一步发展和推广。同时,性能越优异的网络,其参数量和模型复杂度也越大,而一般的计算设备几乎无法运行。因此,对深度神经网络的压缩与加速成为业界的研究热点,但是对复杂模型进行轻量化设计,通常又会导致模型精度的损失。面对模型的轻量化导致精度下降的问题,本文以深度残差网络Res Net为例,对深度神经
骨龄是一种对骨骼成熟度的解释,通过它可以确定人类的生物学年龄,判断儿童的发育情况。骨龄应用诞生至今已有几十年之久,它不仅在儿科的临床环境中起着重大的作用,其应用已延伸至多个领域。目前,众多专业医师仍采用传统的骨龄评估方式,例如评分法、图谱法等。传统的骨龄评估方式耗时费力,容易受到主观因素的干扰且难以普及。在深度学习兴起之前,为克服人工骨龄评估带来的问题,人们尝试使用传统的图像处理方式来辅助医师进行
甲状腺是人体最大的内分泌腺体,甲状腺结节则是甲状腺内部的肿块,可分为良性和恶性两类。我国的甲状腺结节发病率高居全球前列,属于高发性疾病,患者基数大。超声检查由于其高效且无创的特点成为了筛查诊断甲状腺结节的主要手段。甲状腺超声报告通常描述了甲状腺腺体、局灶性病变和淋巴结的形态及血流特征,这些特征是临床医生进行结节良恶性诊断的主要依据。因此,利用人工智能技术对甲状腺超声特征进行深度学习,建立甲状腺结节
移动互联网的飞速发展和智能终端设备的广泛使用使人们的工作和生活方式逐步被网络化,“远程”和“共享”成为人们社会生活方式的主要组成部分。而且随着计算机科学、通信等传统产业的融合,多媒体正逐步深入人类社会的每一个角落。图像是一种可视化的多媒体信息,是最主要的多媒体形式之一,也是传递信息的重要媒介之一。因此,图像传输的安全性引起了研究者的关注。目前保证图像安全传输的方法有两种:图像加密和信息隐藏。本文主
目前肝脏恶性肿瘤依然是世界上最普遍的癌症之一,它也是人类死亡的主要原因,对人类健康构成了巨大的威胁。为了有效降低癌症死亡率,患者依然需要提前对身体进行全面的检查以及尽早接受治疗。然而由于肝肿瘤与其周围软组织之间的对比度较低,分界不明显,而且对于不同的病人,肝肿瘤的形状,体积,数量和位置等差异明显,同时多种扫描方案导致CT图像存在噪声干扰等问题。由于肝肿瘤分割难度较大,仅仅依赖医生的肉眼检测很难得到