基于弱监督深度学习的多尺度目标检测网络

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xiaofeiyu520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术在计算机视觉领域的广泛应用,目标检测作为计算机视觉中的代表问题之一也越来越受到人们的重视。目标检测技术从最原始的利用传统图像特征与机器学习的方法,逐渐发展到如今利用深度学习的方法,且检测的效果也逐步提升。而在目标检测问题中,待检测目标的多尺度特性往往是检测过程中的一个难点。针对这个问题,本文主要研究了一种基于弱监督深度学习的多尺度目标检测网络,并以此为基础设计了一个实时目标检测系统。同时以博物馆内的文物为例进行实现,针对该课题研究过程中遇到的问题展开了一系列研究,主要工作如下:(1)提出了一种改进的YOLO v3多尺度目标检测算法。通过在原算法的基础上使用可变形卷积和增强感受野的策略,提升了原有网络对于多尺度目标的检测效果。此外,由于原网络中有大量的批量归一化(Batch Normalization,BN)操作,这会导致因送入网络数据的批量大小(batch size)过小而影响网络的整体性能。对于这一问题本文使用了组归一化(Group Normalization,GN)策略加以解决。还通过使用标签平滑方法来进一步提升了原有网络的分类性能。而在对于输入数据的处理上,利用了直方图均衡化技术来提升图像对比度,进而提升了网络对于那些对比度较低图像的检测效果。(2)提出了一种基于弱监督深度学习的目标检测网络,其基本原理是使用一种特殊设计的双分支网络。该网络可以仅利用分类损失同时完成分类和定位任务的训练,从而利用图像类别信息就能完成目标检测任务的学习。且与其它弱监督检测网络不同的是,该网络通过预先设置目标候选区域的方式实现了真正端到端的训练,而无需在训练前单独对图像进行候选区域的提取操作。(3)设计并实现了一种基于弱监督深度学习的目标检测系统,该系统主要由视频流处理模块、图像处理模块、目标检测模块和显示模块组成。其中目标检测模块的核心是一种基于弱监督深度学习的多尺度目标检测结构,该结构利用基于弱监督的目标检测网络完成样本标注任务,以此来降低整个系统的成本。此外该结构中执行目标检测的部分采用的是改进的YOLO v3多尺度目标检测网络。通过将目标检测模块中与其它模块相互配合,最终实现了一个成本较低且拥有良好检测性能的实时目标检测系统。最后通过在文物数据集上应用该系统,证明了其实用性与高效性。
其他文献
目的探讨全腹腔镜下脾切除联合贲门周围血管离断术的手术技巧。方法回顾分析2009年3月1日至2012年3月30日全腹腔镜脾切除联合贲门周围血管离断术的临床资料。结果19例均在全
文章主要围绕新农村建设环境下的人才培养问题进行解析和探索。新农村建设在人才培养方面主要应对相关关键性人物进行重点培训,将新农村建设的关键性理论与文化基础传授给农
介绍了水下航行器的深度控制方式,并针对姿态传感器的故障提出了一种基于Stateflow的水下航行器深度容错控制方法。
<正>新四军是抗日战争时期我党领导下的抗日武装力量的两大主力之一,她是一支政治坚定、忠于党、忠于人民、英勇善战的人民军队,她勇敢地担负起了党所赋予的开展华中敌后抗战
目的分析2007-2009年宁波地区产ESBLs大肠埃希菌的检出率,以及对亚胺培南和美罗培南两种碳青霉烯类药物的耐药性和变迁,指导临床合理使用抗菌药物,控制医院感染。方法统计分
本文通过对江门市滨江新区新昌路工程软土路基的成功处治案列,表达了真空联合堆载预压在软基处理施工工期及工程造价方面的明显优势,为今后同类型工程软基处理的设计及施工提
目的 探讨腹腔镜脾切除联合贲门周围血管离断术治疗门静脉高压症的近期疗效及临床应用价值。方法 回顾性收集2015年5月-2016年12月宁夏人民医院肝胆外科8例接受腹腔镜脾切除
针对图像超分辨率重建中纹理细节等高频信息恢复的问题,提出一种基于自注意力网络的图像超分辨率重建方法。该网络框架利用两个重建阶段逐步地将图像的精确度从粗到细进行恢
谈到恐怖电影,人们的第一反应便是离不开血腥、暴力以及死亡。它用这种独特的方式刺激着人们疲惫乏味的视觉神经。出色的票房成绩无疑证明了恐怖电影在商业上的成功,这种不“痛
桩基工程技术正随着我国经济建设的高速发展,已广泛运用于交通铁路、水利水电、工业建筑和城市建设等各个方面。桩与土的相互作用研究也逐渐深入,对桩侧负摩阻力的认识也进一步