基于YOLO的改进目标检测算法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:laiking
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测主要用来解决图像或视频中的物体是什么以及在哪里的综合问题,它是目标分割、目标跟踪、行为识别等更复杂的计算机视觉任务的基石。目标检测在交通、安防、军事、医疗、家居生活等诸多领域被广泛的应用。近年来,巨大的互联网数据量,不断提升的计算机运算性能使得深度学习技术以强大的自动提取特征的能力在计算机视觉、自然语言处理等诸多领域取得了卓越的成绩,基于深度学习的目标检测算法也逐渐取代了基于手工特征的传统目标检测算法。YOLO(You Only Look Once)是一种基于深度回归模型的目标检测算法,其实现了实时检测同时有着令人满意的检测精度。到目前为止,YOLO共有四个版本,YOLO、YOLOv2、YOLOv3和YOLOv4。本文主要通过研究YOLO系列算法的原理,以YOLOv2和YOLOv3的小模型版本Tiny-YOLOv2和Tiny-YOLOv3为基础改进算法,针对算法存在的精度不高,召回率不高等问题,在锚框选取策略、网络结构等方面进行改进,开展了以下工作:(1)YOLO算法存在检测精度不高的问题,与基于区域提名(Region Proposal)的目标检测模型相比召回率更低。YOLOv2中用K-means聚类方法选取先验框的方式使YOLOv2相较于YOLO获得了更高的召回率。本文采用K-means++聚类方法继续优化Tiny-YOLOv2中锚框选取策略,提高真实框与预测框之间的Avg IOU,从而提高模型的召回率。接着在Tiny-YOLOv2加入改进的空间金字塔池化(Spatial Pyramid Pooling,SPP)模块,区别于经典的为全连接层设计的SPP模块,本文的SPP模块适用于全卷积神经网络,其包含三个不同尺寸的最大池化层。SPP模块对网络的包含复杂语义特征的高层特征图进行多尺度变换,最后将多尺度的特征图合并为一个特征图,实现了对局部特征的多尺度利用。本文从PASCAL VOC 2007和PASCAL VOC 2012整理出包含儿童的图片,标注图片中目标的类别和位置信息,最终得到一个符合PASCAL VOC格式的儿童数据集。改进后的模型在自制的儿童数据集上,与原模型相比小幅度增加了模型运算量,提升了召回率和检测精度。(2)目标检测算法中用来特征提取的主干网络对算法的准确率及速度等性能影响很大,YOLO系列算法在改进过程中,特征提取网络也在不断优化。Tiny-YOLOv3特征提取网络简单的叠加卷积层,各层级之间的特征没有较多的信息交流,此外TinyYOLOv3的特征提取网络最后一层使用的卷积核数量较大,占据模型模型大部分的参数量和运算量。DenseNet有着区别于传统卷积神经网络的密集连接模式,本文借鉴DenseNet中的密集连接模式,实验对比包含不同子模块数量的密集连接块对模型性能的影响,构建一个包含五个子模块的密集连接模块对Tiny-YOLOv3的特征提取网络进行改进。密集连接模块能在不引入额外参数量和运算量的情况下,加强模型网络层之间的特征交流,实现特征复用。本文在PASCAL VOC数据集和MS COCO数据集上对TinyYOLOv2,Tiny-YOLOv3和Dense-Tiny-YOLO三个模型实验,并对比三种模型在参数量,运算量,检测速度,平均检测精度和平均召回率五个指标上的数值。实验和结果分析表明,Dense-Tiny-YOLO相对于其他两个模型整体表现更优。
其他文献
世界各国政府为了遏制环境恶化带来的种种灾难,制定了各种减排政策,如碳配额与交易、碳税、碳标签机制等。为了适应各种减排政策,制造业需要做出改变,汽车制造业作为温室气体的排放大户已经被政府纳入了减排政策中,在这种低碳环境下,汽车行业的供应链之间的合作与博弈就显得尤为重要。本文在研究汽车行业产品定价时,构建了一个由汽车制造商,经销商以及消费者构成的供应链,在不同的低碳环境机制下,探究了供应链中的各企业在
目的探讨鼻内镜下鼻腔、鼻窦手术的临床疗效。方法慢性鼻窦炎患者580例随机分为观察组与对照组。对照组患者进行常规药物治疗;观察组患者以鼻内镜下手术法进行治疗,对两组患
目的探讨3~4期的非糖尿病慢性肾脏病(Chronic kidney disease,CKD)患者血清胎球蛋白A的变化及与肾功能的关系。方法以3—4期的非糖尿痛CKD患者60%为研究对象,其中男性34例,女性26例
本文叙述了差压式原油含水分析仪的原理、结构及技术指标。并以试验为依据说明了影响分析精度的各种因素,提出了解决办法。
期刊
<正> 单井计量技术在油气集输工艺技术中占有重要的位置.目前,各油田所用的多井式幅射状计量站流程,工艺复杂,建设投资大,不适用于低产井.若能解决井口计量问题,就可采用多井
对不同级别的晒青茶和烘青茶茶叶主要成分进行了测定,探讨了加工方式、茶叶等级与茶叶成分之间的关系。结果发现烘青茶和晒青茶水浸出物、茶多酚、咖啡碱含量都随着茶叶等级
工业废水处理是多数企业需要慎重对待的工作,废水处理效果直接决定着废水对环境造成的负面影响程度,也关系着废水利用效率,所以企业会应用多种处理手段,使废水中的重金属以及
由于电桥法具有测量精度高、稳定性好、成本低等优点,仍被广泛运用于精密电阻测量领域。随着科技的发展与进步,数字化直流电桥开始取代传统的手动平衡电桥。目前,国内的数字
修订的背景《独立审计具体准则第17号-持续经营》自1999年7月1日起施行后,对注册会计师针对被审计单位的持续经营能力恰当地发表审计意见具有明显的规范作用.
淤胆型肝炎又称毛细胆管炎型肝炎,其主要临床表现为黄疸,属于中医"黄疸"范畴.目前中医药疗法在淤胆型肝炎的治疗过程中得到了广泛的应用,为探求其用药规律,笔者查阅了1995年