论文部分内容阅读
人脸检测是计算机视觉领域的一个十分基础的问题,在人们的日常生活中起着极大的作用。近几年来,随着人工智能的兴起,人脸检测技术的相关应用逐渐增多,到目前为止,人脸检测算法已经广泛使用在安防领域,娱乐领域,图片检索领域等方面,它正在以极快的速度发展,以多种多样的形式影响着我们的生活。虽然人脸检测的算法研究起源时间相对较早,技术积累相对浑厚,但是,随着各种应用的快速兴起,目前的人脸检测算法性能依然不能满足现有社会的需求,尤其是在实际场景中性能依旧不够强悍。可以说人脸检测算法研究任重而道远。本文利用卷积神经网络训练框架,对人脸检测算法进行研究,目的在于提升检测器的检测性能表现。本文基于单步检测器S3FD进行改进,分别从网络结构与数据处理两个关键步骤进行考虑,提出多个改进措施,提升了检测器的实际性能表现。在网络结构方面,由于特征融合方法能够有效利用上下文信息,提高对特征的表达能力,因此,为了提高对较小人脸的检测性能,本文提出了以下几个方面的改进:(1)本文设计了一种低层特征交织结构,将前一层特征、当前层特征、后一层特征融合起来进行检测,提升当前层特征的表达能力。同时针对高层特征不适合于低层特征进行融合,本文只选取低层的卷积层进行特征融合。(2)提出一种内容融合结构,采用类似Inception结构,将具有不同大小感受野的特征更好的融合在一起,提升对不同尺度人脸的检测能力。(3)在数据处理方面,本文提出了一种新的数据处理方法,通过调整输入人脸框的尺度,将人脸框与锚点更容易匹配在一起,从而减少背景噪声的影响,进一步提升网络的性能。本文针对上述提出的多个创新点,提出了四个增强型网络结构,分别为VGG-16S,VGG-16S+,ResNet-50S,ResNet-50S*,实现了性能的大幅度提升。在实际的测试中,本文提出的多个网路结构均展现出了较好的性能,实现了在FDDB和WIDER FACE测试集上的极具竞争力的结果。其中本文设计ResNet-50S网络在FDDB评测中达到了世界第二,同时在速度上依旧能够保持在1OFPS以上。