基于卷积神经网络的人脸检测研究

来源 :北京邮电大学 | 被引量 : 5次 | 上传用户:yp888yp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸检测是计算机视觉领域的一个十分基础的问题,在人们的日常生活中起着极大的作用。近几年来,随着人工智能的兴起,人脸检测技术的相关应用逐渐增多,到目前为止,人脸检测算法已经广泛使用在安防领域,娱乐领域,图片检索领域等方面,它正在以极快的速度发展,以多种多样的形式影响着我们的生活。虽然人脸检测的算法研究起源时间相对较早,技术积累相对浑厚,但是,随着各种应用的快速兴起,目前的人脸检测算法性能依然不能满足现有社会的需求,尤其是在实际场景中性能依旧不够强悍。可以说人脸检测算法研究任重而道远。本文利用卷积神经网络训练框架,对人脸检测算法进行研究,目的在于提升检测器的检测性能表现。本文基于单步检测器S3FD进行改进,分别从网络结构与数据处理两个关键步骤进行考虑,提出多个改进措施,提升了检测器的实际性能表现。在网络结构方面,由于特征融合方法能够有效利用上下文信息,提高对特征的表达能力,因此,为了提高对较小人脸的检测性能,本文提出了以下几个方面的改进:(1)本文设计了一种低层特征交织结构,将前一层特征、当前层特征、后一层特征融合起来进行检测,提升当前层特征的表达能力。同时针对高层特征不适合于低层特征进行融合,本文只选取低层的卷积层进行特征融合。(2)提出一种内容融合结构,采用类似Inception结构,将具有不同大小感受野的特征更好的融合在一起,提升对不同尺度人脸的检测能力。(3)在数据处理方面,本文提出了一种新的数据处理方法,通过调整输入人脸框的尺度,将人脸框与锚点更容易匹配在一起,从而减少背景噪声的影响,进一步提升网络的性能。本文针对上述提出的多个创新点,提出了四个增强型网络结构,分别为VGG-16S,VGG-16S+,ResNet-50S,ResNet-50S*,实现了性能的大幅度提升。在实际的测试中,本文提出的多个网路结构均展现出了较好的性能,实现了在FDDB和WIDER FACE测试集上的极具竞争力的结果。其中本文设计ResNet-50S网络在FDDB评测中达到了世界第二,同时在速度上依旧能够保持在1OFPS以上。
其他文献
<正>科普影视包括科普电影和科普系列剧,内容不仅涉及自然科学知识,而且包括科学方法、科学思想和科学精神,对促进人的想象力和创造力的发展,起着重要作用。我们把科普影视作
长期以来写作学界一致把论点、论据和论证作为议论文三要素的通说是不确切的。因为,议论文的要素应该是有形的文字实体,论证是一种过程和方法,不能与论点、论据并列。三要素
<正>针对现有的输液报警器功能少、误差较大的问题,利用光电门、重力传感器和温度传感器三种设备设计了一种新型的智能输液装置。试验表明,该智能输液装置成功实现了预计的多
在网络舆情事件中,文本既是舆情理解的渠道,也是舆情表达的产物,而文本所固有的互文性为观察当下网络舆情的生成与扩散提供了一种视角。从舆情生成的过程来看,先前文本为网民
直流系统是变电站的重要组成部分,其设计方案的合理性直接影响变电站的安全、可靠运行。针对500kV变电站实现无人值班新模式,对直流电源的安全性、可靠性提出更高的要求;统计
<正> 一九七五年至今,我们对青海省海北、海西地区四个国营农场的近万名干部、工人、家属进行胃溃疡等病的普查初筛工作。这些地区的海拔高度分别为2860公尺、3100公尺、3300
教育游戏在小学英语教学中已经成为一种新型的辅助教学的有力方式,在小学英语教学中的应用具有很广阔的发展前景,本文对教育游戏在小学英语教学中的实际应用进行了分析。
随着我国经济管理体制改革的深入,改革行政管理体制的要求越来越迫切,推动政府职能转移便成为深化改革的重要切入点和突破口。政府向行业协会商会转移职能成为现阶段加快政府
<正> 纵观过去和现在世界丝绸生产和贸易形势,全球丝绸业自70年代以来发展非常迅速。目前,中国和印度已成为主要的丝绸生产国,而发达国家则成了丝绸消费国。凭藉中国丝绸业的
采用等体积浸渍方法制备不同Cu负载量的Cu-ZSM-5催化剂,对催化剂理化特性和催化快速SCR反应活性进行实验研究,同时对这些催化剂样品进行了NO、NO/NO2的程序升温脱附(TPD)实验,