Mask Wearing Detection Based on Deep Learning

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:maruijun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自2019年12月新冠疫情爆发以来,已经对全球人类的健康和生活产生了重大影响。据约翰斯·霍普金斯大学统计数据,截止北京时间2021年1月27日,全球新冠肺炎确诊人数已经破亿,全球新冠肺炎死亡人数超过215万例。同时,病毒的传播扰乱了全球供应链,造成全球金融市场显著波动。与2020年2月中旬相比,欧洲股市已经下跌约30%,为2008年金融危机开始以来的最大单月跌幅,全球年经济增长率预计将下降2.5%左右。尽管如此,中国得益于疫情防控速度快、效率高、效果好,在经济下滑的大背景下,仍能成为2020年全球唯一一个实现经济正增长的主要经济体。虽然受新冠疫情冲击,2020年第一季度国内生产总值增速骤降至-6.8%,但随着疫情防控和复产复工的有序进行,实际国内生产总值同比增速在第二季度和第三季度分别反弹至3.2%和4.9%,预计2020年全年实际国内生产总值增速约为2.1%。这一切都与中国科学的防治,精准的政策实施密不可分。但是研究表明,新型冠状病毒主要通过呼吸道飞沫、密切接触等方式进行传播,并且随时存在大规模聚集性传染爆发的可能性。因此,在公共场合出入正确佩戴口罩,是做好防疫的关键一步。但公共场合人流量大,检测时间短,监督成本高,完全依靠人力检查存在效率低下,工作强度大,资源浪费的问题。因此如何以快速高效的办法实施公共场合人员口罩佩戴检测,便成为一项重大考验。本文将利用目标检测算法,实现口罩佩戴检测,为防疫做贡献。目标检测的功能是找出输入图像中的目标位置并对目标位置进行分类,在人脸识别,标志检测,文本检测等领域有着重要的作用。目标检测算法主要分为传统目标检测算法和基于深度学习的目标检测算法。传统的目标检测算法包括Viola-Jones(V-J)检测器算法,Histogram of Oriented Gradient(HOG)检测器算法,Deformable Part-based Model(DPM)算法等。传统目标检测算法在区域选择策略中没有较强的针对性,导致产生了较高的时间复杂度和窗口冗余的问题。同时,手工提取特征的方法,对于复杂的外观形态和多种的背景鲁棒性不好,而分类器又高度依赖特征提取,这就导致传统目标检测算法复杂,精度差。因此,传统的目标检测算法逐渐被淘汰。近年来,随着人工智能的发展,引入了基于深度学习的目标检测算法来解决传统目标检测算法存在的问题。现如今基于深度学习的目标检测算法主要分为双阶段目标检测算法和单阶段目标检测算法。双阶段目标检测算法是对输入图像先筛选出候选区域,在对候选区域进行分类和位置回归从而输出结果的目标检测算法,包括区域卷积神经网络(Region Convolutional Neural Network,R-CNN)系列算法、基于区域的全卷积网络(Region-Based Fully Convolutional Network,R-FCN)算法、掩模区域卷积神经网络(Mask Region Convolutional Neural Network,Mask R-CNN)算法等。R-CNN 是由 Girshick 于 2014 年将卷积神经网络(Convolutional Neural Network,CNN)应用于目标检测从而产生的双阶段目标检测算法。R-CNN将AlexNet与选择性搜索算法相结合,主要结构包括区域选择、深度提取、分类回归三个模块。R-CNN在平均精确度均值(mean Average Precision,mAP)上较于传统目标检测算法有很大提升,但是仍存在训练、测试缓慢,复杂度高、计算量大等问题。针对以上问题,空间金字塔池化卷积网络(Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition,SPP-Net)算法应运而生。何恺明团队在现有的网络中加入空间金字塔池化层(SPP),可以生成固定长度的特征向量,避免了重复计算卷积特征,使得SPP-Net算法比R-CNN算法计算速度在PASCAL 2007的数据集上快24-102倍,平均精度值也提升至59.2%。随后,基于边界框和多任务损失分类的快速区域卷积神经网络(Fast Region Convolutional Neural Network,Fast R-CNN)算法由 Girshick 提出,以解决现有算法空间消耗大,分类器训练繁琐等问题,该算法融合目标检测、分类和定位于一个模型中,提高了检测的精度和速度。同年,Faster R-CNN(Faster Region Convolutional Neural Network)由任少卿和Grishick团队联合提出,该网络由卷积层、区域建议网络(Region Proposal Network,RPN)、RoI 池化层(Region of Interest Pooling,RoI Pooling)、分类层和回归层组成,其中RPN取代选择性搜索算法,并实现了端到端的训练,使得网络的训练速度得到大幅度提升。随后,Mask R-CNN的提出是对前面算法的优化,在原来的分类和回归的两个任务上,增加了一个Mask网络分支用于分割任务,提高了目标检测分支的精度。单阶段目标检测算法采用了回归分析的思想,省略了双阶段目标检测算法中的候选区域生成步骤,直接得到目标的分类定位。YOLO(You Only Look Once)系列算法作为单阶段目标检测算法的代表之一,其中的YOLOv4算法将被应用于本文的实验。YOLOv4保留了 YOLOv3的头部部分,将主干网络从DarkNet-53转为CSPDarkNet53;同时采用SPP和Path Aggregation Network(PAN)模块相结合,加强特征提取网络的改进;在数据增强方面使用了马赛克(Mosiac)增强法;使用Generalized Intersection over Union(CIOU)作为回归损失函数等大幅度提高了模型的检测精度。另一个单阶段目标检测算法是单次多尺度检测器(Single Shot MultiBox Detector,SSD)算法,该算法的思想是分层提取特征,它通过卷积层对目标的定位和分类减少了计算量;并且没有对目标检测过程设置空间限制,这使得该算法在成群的小目标检测中有很好的应用。由于经过实验测试后,单独使用目标检测网络作为口罩佩戴检测模型的准确率,并不能达到预测效果,因此本文创新性地提出了识别+分类的口罩佩戴检测方案进行实验,将目标检测网络仅作为人脸检测识别器,引入分类网络实现口罩佩戴分类的功能,因此实验了多组分类网络。其中VGG(Very Deep Convolutional Network)网络是一种经典的网络,它具有多种变型并且被广泛应用在目标分类、人脸检测等领域。其中的VGG16是VGG的优化模型,它包括13个卷积层和3个全连接层,结构简单,网络复杂度低,计算量下降,在数据集上不会出现过拟合问题。残差网络(Residual Network,ResNet)也是目前深度学习领域中一种常用的模型之一,它是一种极深的卷积神经网络模型,通过能够跳过一层或多层的短路连接的结构,解决了因为网络深度增加而导致的网络退化问题,ResNet常用的网络结构是ResNet50和ResNet101,二者并没有本质的不同,只是结构上ResNet101在每个残差块中使用了更多的卷积层。最后一种用于移动视觉应用的高效卷积神经网络:MobileNet,这是一种轻量卷积的神经网络,它的特点参数少,运行速度快,占用显存低,主要核心是使用深度可分离卷积的操作。其中的MobileNetV2是流线型架构,它的倒置残差结构大幅度减少了网络参数和计算量,使得网络速度有了大幅度提升。本文结合上述研究背景,创新性地提出了基于深度学习的优化算法和混合模型方案,以提高口罩佩戴检测的效率,本文主要工作内容可以概括为以下三个方面:1.由于口罩识别研究较晚目前没有主流公开的数据集,所以本文收集并制作了一个拥有4000张图片的各种复杂场景的口罩数据集,其中包括医院、汽车站、火车站、学校、小区等。由于数据集有限,对数据集采用了一系列的增广策略:水平镜像、添加噪声、随机裁剪、随机亮度和对比度增强等,把数据集扩充为8000张图片,并使用LabelImg对图片中人脸进行标注。2.本文以YOLOv4算法作为基础,提出了改进的YOLOv4算法:利用K均值聚类算法(K-means clustering algorithm)对数据集聚类,在CSPDarknet53主干网络的输出的特征层P3、P4后分别增加了一个SPP结构的优化YOLOv4模型。并分别在自制数据集上对比试验了 Faster R-CNN模型、原始YOLOv4模型、SSD模型以及优化的YOLOv4模型,其中6000张图像用于训练,2000张图像用于测试,训练和测试的样本无重叠。实验结果发现优化的YOLOv4模型在口罩佩戴检测的综合性能是要优于Faster R-CNN模型、SSD模型和原始的YOLOv4模型。3.优化后的YOLOv4模型虽然在口罩佩戴检测的人脸识别功能有所提升,但对口罩佩戴分类的准确率达不到期望效果。因此本文创新性地提出了识别+分类的口罩佩戴检测方案:选择改进YOLOv4模型作为人脸检测器,只用该模型识别人脸。同时引入分类网络,分类改进的YOLOv4识别出的人脸是否佩戴了口罩。在分别对比实验了 VGG16网络、ResNet50网络、ResNet101网络和MobileNetV2网络后,选择ResNet50和MobileNetV2作为分类网络,分别融合改进的YOLOv4模型作为口罩佩戴检测的混合模型。实验结果证明了,采用上述混合模型在口罩佩戴分类的准确率上提高了 1.1%。虽然本文提出的创新型的优化模型,和识别+分类的口罩佩戴识别方案,取得了初步的研究成果,但仍然存在可提升的空间。在未来的研究中,可以从以下方面对研究进行改善:扩充数据集,提高口罩识别方案的精确性;优化网络结构,提升检测的速度;增加识别的功能,实现在佩戴口罩的情况下,识别出被检测者的身份。通过以上内容完善口罩佩戴检测,更好地为防疫做贡献。
其他文献
永磁同步电动机(permanent magnet synchronous motor,PMSM)相比于其它类型电机,具有结构紧凑、可靠性高、运行效率高、功率密度大、损耗小、外形尺寸设计相对灵活等诸多优点,故其应用范围变得越来越广泛。近些年来,为了降低电机调速系统成本、提高系统可靠性以及拓宽电机的应用场合,无传感器控制系统的应用逐步成为该领域的研究热点。然而转子位置跟踪速度、估计精度以及系统的稳定程
本文设计并实现了一种基于micro:bit的多功能扩展板。这种设计主要包括硬件和软件两个部分。设计的主要目的是为了扩展micro:bit的功能和性能。硬件设计的工作主要是在用Altium Designer 2019画出本文提出的扩展板的原理图,并根据原理图绘制相应的PCB电路图用于进一步加工。同时,原理图和PCB图都进行了相应的软件仿真测设并且加工得到了实物。集成在micro:bit扩展板上的各种
车牌识别技术作为计算机图像视觉识别研究领域的一个热门研究课题,在计算机发展的年份中已经不断有新的算法和技术手段被应用进来。常见的车牌检测识别一体化系统一般使用图像处理的基本图像预处理手段和基于模式识别的匹配技术进行识别。汽车车牌本质上可以看作汽车的身份证,车牌与汽车是唯一绑定的关系,通过对于车牌信息的准确获取,便可以获取到与当前车辆相关的各种信息。在常见的交通管理中,对于车牌的准确识别能够大幅提升
自适应波束形成技术作为阵列信号处理技术中的关键技术,在通信、雷达、射电天文、地震勘探、声纳、电子对抗等领域应用广泛。自适应波束形成技术可以定向地接收空间中某一特定方向上的信号,阻止其他方向上的信号进入系统造成干扰,具有空域滤波的效果。在无线通信系统中,自适应波束形成可以提高频谱利用率,扩充信号容量。随着无线通信需求的爆发式增长和无线通信技术的飞速发展,5G通信技术即将进入商用,未来智能设备将工作在
随着网络信息时代的到来,突发公共卫生事件中网络谣言的传播方式和特征发生了巨大变化,对事件本身的发展和社会秩序都造成了恶劣的影响,在此背景下,研究如何有效应对突发公共卫生事件中的网络谣言就显得尤为必要。本文在对国内外学者的相关研究成果进行研读的基础上,综合公共管理学、心理学、政治学等多学科视角,采用文献研究法、案例分析法和内容分析法,以新型冠状病毒性肺炎疫情期间的网络谣言治理为例,选取腾讯较真平台于
随着光通信行业的发展,人们对带宽的需求越来越高。单模光纤的通信容量已接近香农极限,难以满足日益增长的通信需求。为了克服光传输的能力限制,许多研究人员致力于空分复用的研究,这为光传输开辟了一个新的维度。模分复用作为空分复用的一种技术,通常采用由少模光纤支持的正交空间模式并行传输数据;该技术能够成倍提升单根光纤的容量,拥有广阔的前景。模分复用器和解复用器是模分复用系统的关键器件之一,本文提出了两种新型
人类生活的世界是相互连接的,实体可以被视为具有不同属性的网络结构上的节点,不同的实体之间根据属性的差异又各自具备不同的相互关系。对于实体之间依据属性区分进行关系建立的操作被成为关系数据建模。近年来,关系数据建模主要跟从图深度学习和统计关系学习两个领域。图神经网络能够利用数据的属性和结构,通过非线性的神经网络内层,对目标进行端到端的训练和输出,统计关系学习方法可以建立标签之间的依耐性,可以使得这种学
视觉目标跟踪是机器视觉领域中一个非常重要的分支,在智能制造、安防监控、无人侦察、无人驾驶、人机交互和智能诊断等领域有着十分广阔的应用。给定视频目标初始化信息后,视觉目标跟踪旨在对后续视频目标进行位置定位、尺寸估计等。目前已有许多研究者对其进行研究,并在一些场景中取得了不错的跟踪精度。然而,在具体的应用当中,视频目标往往会处于十分复杂的场景,可能出现遮挡、高速运动、目标抖动、光照变化、目标形变和背景
随着互联网技术的高速发展,基于互联网技术的应用在人们的日常生活中得到了广泛应用,大量的数据随着这些应用的使用而产生,在这些数据中有相当一部分是以文本方式存在的。又由于现在信息传递的速度非常快,这使得人们每天都会面对大量的文本信息。人们在处理这些信息时会出现力不从心的现象。人们为了能够快速的得到对自己有用的文本信息并且能够快速的利用这些文本信息就必须对这些文本信息进行处理。而文本分类就是对文本信息处
波动方程是一类重要的二阶偏微分方程,主要用于描述波的扩散和传播,其解有助于我们更加直观地了解波的传播特性,并应用于实际工程中。在波的传播过程中,各种类型的介质存在导致波产生耗散现象。因此,在分析波动方程的一些性质时,我们通常把阻尼考虑在内。本文考虑了一类带有结构阻尼的拟线性波动方程(Semilinear Structural Damped Wave equations,SSDW),模型如下:(?)