基于深度学习的人脸检测技术研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:lvxiaoyongheyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,数据量越来越大,我们需要更智能的方法来处理数据。在这之中,对于海量图片、视频的处理要求越来越高。人脸检测作为其中非常重要的技术得到越来越多的重视。近几年,随着深度学习的发展,计算机视觉相关的任务逐渐被深度学习所取代。对于人脸检测任务,人们也开始探索利用深度学习的方式来解决。本文首先介绍了人脸检测算法常用的几大类方法,并分析比较了各类方法的主要内容及优缺点。接着介绍了我们设计的人脸检测系统的级联模型架构,主要分了低级、中级和高级这三级结构,对候选框进行由简到难地判别。这样可以快速地过滤掉容易判别的非人脸候选框,而将主要精力集中在难以辨别的候选框上面,从而节约时间。在低级和中级结构中,不仅分别有判别网络对候选框进行判别过滤,还分别有位置校正网络对剩余候选框的位置进行校正。在高级网络结构中,我们将目标检测中的FastR-CNN[3]技术应用过来,对剩余候选框进行最终的判断并校正。我们在每一级结构中都用到了一些策略,主要包括利用非极大值抑制NMS算法去掉重合度较高的选框以及用PReLU[29]激活函数代替普遍使用的ReLU激活函数。在介绍完系统架构后,本文继续介绍如何训练这套系统。首先介绍训练所用的数据集AFLW[16]和Wider Face[28],以及我们如何去除了这两个数据集中不适合训练的样本。然后,我们为增大模型的泛化性,对数据进行了增强处理,包括模糊、加噪声等方法。接着,介绍了关键的训练过程以及训练参数。最后,由于每个网络模型处理的任务不同,所以每个网络的训练数据也不同,文章依次介绍了每个网络的输入训练数据。训练完各级网络并搭建好系统后,我们在2个权威数据集FDDB[1]和AFW上做了测试。在FDDB数据集上,当整个数据集错误检测框个数为2000时,达到了 91.87%的检测率,高于大部分近两年在FDDB官网上提交结果的方法。在AFW数据集上,我们的平均准确度AP达到了 95.35%,同样优于最近两年大部分性能良好的方法。我们利用VGA (640*480像素)大小的图片测试这套系统的平均时间性能,在单线程并检测40*40像素以上人脸的情况下,使用1.2GHz的CPU速度为3.2FPS,使用NVIDIAK40 GPU的速度为66.7FPS。
其他文献
党的十八届四中全会明确指出:“各级党政机关和人民团体普遍设立公职律师。”近年来,随着社会主义市场经济发展和经济全球化进程加快,各级党政机关在重大行政决策、重要行政行为中面临的考验越来越严峻,需要应对和处理的复杂法律事务越来越多,公职律师制度建设刻不容缓。本文运用文献综述法、比较研究法和调查问卷法,首先对律师、公职律师、社会律师、法律顾问、法制机构人员、法律援助律师等概念进行了界定和比较界定;对政府
密江林场铁矿位于牡丹江市海林市。区域大地构造位置处于伊春—张广才岭造山带(Ⅳ)方正长汀断裂边缘隆起带中北部。研究区内侵入岩主要有晚三叠世-早侏罗世正长花岗岩(T3J1ξ
水上交通安全与人民群众的生命财产安全紧密联系。随着腹地经济的不断发展,诸如海上风电项目投产运营,同一海域下大量渔船的捕捞作业等现象,导致射阳港航区内通航密度不断加大,水上交通安全形势日趋严峻。尤其是在“8.12天津港爆炸事故”和“3.21响水陈家港爆炸事故”后,更加敲响水上交通安全的警钟。盐城射阳港与韩国和日本隔海相望,海岸线长达103公里,较长的海岸线及与邻国相望的地理位置使得射阳港具备得天独厚
普惠金融,是为城镇的微型企业、农民和低收入者等弱势群体提供的一种金融服务,它不断改善着我国的经济发展方式,并促进我国社会的公平与和谐。但普惠金融在我国,仍属起步阶段。不过,随着国家金融政策的开放,非银金融机构政策扶持力度的增加,税制结构与制度的完善,非银机构税费的减轻,未来我国普惠金融业务必将取得商业化的成功。金融机构对于国家政策和经济的变化是非常敏感的,近些年国家政策、经济的变化比较频繁,给普惠
表面等离激元共振成像(Surface Plasmon Resonance imaging,SPRi)是利用金属结构的表面等离激元共振(Surface Plasmon Resonance,SPR)效应,发展的具有无标记、高灵敏及高通量
随着技术发展,人脸标注系统的需求日益增大,而人脸标注系统的一个特色功能是基于人脸聚类。无监督聚类算法在这个问题上效果有限,所以就出现了使用约束条件的约束聚类算法。
声场重现技术可以实现汽车或者飞机噪声在实验室内的重现,通过这种方式可以在室内对汽车噪声的声品质进行精确的评价。本文旨在通过仿真和实验对Least-Squares(LS)和Least-ab
在经济快速发展和城镇化建设不断加快的过程中,中心城市的人口快速增长和有限的土地资源矛盾问题给人们的生活和生产带来了很多不便,该问题迫切需要解决。国内的建筑师们为了让土地资源利用最大化,采用不断增加结构建筑高度的方法。在最近十年的发展里面,我国建造了一些知名的的200 m~400 m的超高层建筑,其结构多为钢框架-核心筒形式。为了减小钢框架与核心筒之间因为材料的收缩徐变影响造成的性能差别,楼盖梁选用
竹节草[Chrysopogon aciculatus(Retz.)Trin.]是多年生禾本科(Gramineae)金须茅属(Chysopogon Trin.)热带草坪草,前人已开展大量的研究,并投入草坪建植。然而关于竹节草抗除草剂的相关研究尚未报道,为了防治禾本科草坪杂草,化学防除最为便捷有效,但因除草剂的广泛使用,当前市面上诸多杂草出现抗药性。I因此本实验以62份竹节草种质资源为材料进行抗ACC
近年来,急剧增长的数据规模导致太多的边拥挤在有限的展示空间中,所谓的视觉混乱(visualclutter)严重阻碍了点线图的可用性。边绑定将视觉上相似的边捆扎在一起形成可辨识的