树叉型卷积神经网络在动态人数检测上的研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户：qiaolei8214122

【摘要】

：

随着互联网技术的不断发展以及人们生活水平的不断提升,对互联网的应用也越来越广,要求也越来越高,从最初的查阅资料到渗透到生活中衣食住行等各个方面,例如,应用到人脸识别

【作者】

：

杨雷

【出处】

：

广西师范大学

【发表日期】

：

2020年01期

【关键词】

：

卷积神经网络树叉型模块特征提取目标检测动态人数检测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术的不断发展以及人们生活水平的不断提升,对互联网的应用也越来越广,要求也越来越高,从最初的查阅资料到渗透到生活中衣食住行等各个方面,例如,应用到人脸识别、智能驾驶、目标检测以及目标追踪等领域。在应用的同时对其性能的要求也越来越高,不仅要具有较高的准确性,还需要及时性等。而提高准确性的同时往往会带来计算量的陡增,这就必然对计算机硬件等要求更高,而且还易导致其延时,降低及时性。计算机硬件已经有了质的飞跃,5G时代的到来无疑是人工智能发展的一个窗口期。而深度学习作为人工智能的一个重要分支,其重要性不言而喻,卷积神经网络(Convolutional Neural Network)作x为深度学习领域的杰出代表,更是受到相关研究者的追捧。本文就是从卷积神经网络的原理出发进行研究,通过设计改进卷积神经网络结构,提高其网络的准确率,并且尽量降低网络参数,使其更具实用性。利用图像分类识别对其进行性能检验,在此基础上对目标检测进行研究并改进。本文最终将其应用于动态人数检测。本文主要研究内容包括以下四个方面:(1)通过设计树叉型卷积神经网络,利用多卷积核进行交叉卷积,采用split-transform-split-merge方式。不仅增加网络的复杂度,有利于特征筛选,提升网络的泛化能力,还能提取特征图中更为隐性的特征,并且网络的基本架构保持不变,将网络中间卷积层中的传统卷积模块替换成树叉型模块,通过在几个公开数据集中进行训练,对比了树叉型卷积网络与传统卷积网络的性能,其中本文树叉型模块的网络在101_food、caltech256、GTSRB和cifar10中的准确率相比于传统的CNN分别提高了4.1个百分点、4.7个百分点、1.8个百分点和1.9个百分点。从实验结果中可以看出,网络在识别精度性能上有所提高。(2)本文利用树叉型模块对经典Darknet53进行改进。在树叉型模块中融入残差结构,一方面,有利于优化树叉型网络,利用残差结构所具有的鲁棒性,从而缓解卷积层加深所带来的过拟合。另一方面,实现树叉型模块对深层次网络Darknet53的优化,从而也进一步证实树叉型模块的可行性。改进的Darknet53比Darknet53的准确率提高了2.4个百分点。(3)本文的目标检测采用能实现多任务的网络来完成,即通过一个网络实现目标位置的定位以及目标类别的分类。采用第4章中的Darknet53以及改进的Darknet53网络作为目标检测的两个基础网络;采用边界框预测方法(Bounding Box Prediction)进行目标位置定位;为实现小目标物体检测,采用类似金字塔网络(FPN)进行多尺度检测。多目标检测即多个目标类别进行检测,比如本文采用的COCO2014数据集总共有80类,则通过目标检测训练后能够对该80类目标进行检测,采用了三种不同尺度的特征图进行检测,每种尺度检测时输出的特征图则为255张,包含目标位置、目标置信度以及目标类别预测。通过对两个网络的目标检测性能进行对比,改进的目标检测网络mAP提高了2.7个百分点,检测时间缩短了3 ms。(4)实现动态人数检测。动态人数检测既实时的在视频流中检测出每一帧中的行人,并统计其行人的数量。本文采用了深度学习中的卷积神经网络方法,动态人数检测是在多目标检测的基础上进行单目标检测,检测原理基本一致。动态人数检测也是计算机视觉研究领域中的热点以及难点,不仅需检测出视频帧中的行人,还需确定其位置和大小,本文采用矩形框表示,这也类似于人脸检测,属于典型的目标检测问题。动态人数检测一方面简化了多目标检测的计算量,使检测更具实时性;另一方面使得卷积神经网络方法更加契合实际需求,其可以应用于智能机器人、智能视频监控以及汽车无人驾驶系统(ADAS)等领域,从而更加具有实用性。

其他文献

鄱阳湖区居民福祉供需匹配测度及其空间分异特征研究

十九大报告提出,我国社会主要矛盾已经转变为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。分析福祉供需匹配的空间关系是当前深入推进区域协调发展和全面建

学位

居民福祉供需匹配匹配度空间分异鄱阳湖区

MEHP荧光探针的合成及其在毒靶细胞的原位检测

背景邻苯二甲酸二(2-乙基)己酯[di(2-ethylhexy1)phthalate,DEHP]为代表的邻苯二甲酸酯类塑化剂是公认的环境内分泌干扰物(environmental endocrine disrupting chemicals,EE

学位

内分泌干扰物MEHP荧光探针原位检测毒靶细胞

彩色图像乘性噪声去除的高阶变分模型及其快速算法

图像在传输或存储等过程中会产生噪声,根据图像噪声和图像信号之间的加乘关系,可以分成加性和乘性两种噪声。近年来,出现了许多用于去除加性噪声的变分模型。但是对彩色图像

学位

彩色图像乘性噪声变分模型分裂Bregman算法增广Lagrangian算法

一种单发单收同时同频全双工自干扰射频域抑制技术研究

随着5G移动通信时代的到来,同时同频全双工技术作为提升频谱利用率的重要技术之一,日益成为业界关注的焦点。然而,由于收发天线距离较近且发射信号和接收信号之间的功率差异

学位

同时同频全双工射频域自干扰抑制自干扰抑制性能单发单收

鄱阳湖区居民福祉产出效率测度与优化调控研究

近年来,鄱阳湖区的经济发展水平快速提高,人民生活得到明显改善。进入新时代,随着鄱阳湖区居民对美好生活的需要日益增长,如何有效提升鄱阳湖区居民福祉产出效率,这对于鄱阳

学位

福祉产出效率三阶段DEA空间差异鄱阳湖区

基于反向散射的高阶调制设计与研究

近些年随着物联网的快速发展对通信电路提出了更高的要求,不仅需要电路结构简单化,尺寸小型化,同时也要求电路功耗小,这就产生了反向散射无线电的解决方案。反向散射通信技术

学位

反向散射高阶调制毫米波功率分配器

几丁质酶产生菌的筛选及其基因克隆

几丁质又称为甲壳素或甲壳质(chitin),是一种由N-乙酰氨基葡萄糖以β-1,4糖苷键连接而成直链状高分子生物多聚体,广泛存在于自然界中。几丁质是大多数真菌细胞壁的主要成

会议

轴承套圈外观缺陷视觉检测方法研究

制造业在国民经济中占据主导地位,新中国成立以来尤其是改革开放以后,素有“工业关节”之美誉的轴承相关制造业在我国发展势头强劲,但由于其在生产过程中可能出现各种缺陷,轻

学位

轴承套圈视觉检测图像处理缺陷提取人机交互界面

自然场景图像中汉字的识别研究

随着电子智能设备的普及,人们获取自然场景中的图像越来越方便,研究识别自然场景图像中的汉字也逐渐成为热点问题。针对目前一些方法中识别效率低下、准确率不高、拟合较差等

学位

汉字的检测定位与识别最大稳定极值区域笔画宽度变换RBF神经网络深度卷积神经网络

基于磁性纤维素纳米晶青霉素酰化酶的固定化及催化头孢克洛合成的研究

头孢克洛属于第二代半合成头孢菌素类抗生素,其通过使转肽酶失活,干扰细菌细胞壁最终阶段的合成达到杀菌目的。头孢克洛对多种革兰氏阳性菌、革兰氏阴性菌均具有很强的杀灭作

学位

青霉素酰化酶磁性纤维素纳米晶三羟甲基磷头孢克洛深度共熔溶剂

树叉型卷积神经网络在动态人数检测上的研究

其他学术论文