复杂场景中基于YOLOv3的鲁棒人脸检测研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:hujun_xiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来人脸检测被广泛应用在校园门禁、刷脸支付、视频监控和目标追踪等各个方面。同时,人们在实时性、安全性和可靠性上,对基于人脸的特征点定位、检测和识别等相关应用提出了更高的要求。此外,在人脸密集、尺度不一、与背景高度相似以及高度遮挡等复杂场景中,人脸检测经常达不到预期效果,人脸检测技术上的挑战依然存在,复杂场景中的鲁棒人脸检测仍然是国内外的热点研究。为了提高人脸检测在复杂场景中的应用性,针对检测中遇到的问题和挑战,论文设计实现了一种基于YOLOv3的鲁棒人脸检测模型,具体工作如下:(1)复杂场景中,人脸目标与图像背景在形状、颜色相似时,容易出现误检现象,本文提出了一种基于注意力机制的人脸检测方法YOLOv3-attention。首先设计了基于混合域的注意力模块,通过生成特征权重的方式,获取图像中所需重点关注的人脸区域信息,抑制无关的背景区域信息。此外,网络中使用的anchor也是一个重要的部分,本文采用K-means++算法对人脸真实框的尺寸进行聚类分析,设置更小尺寸的anchor box来捕获小人脸目标。通过WIDERFACE人脸数据集上的实验,验证YOLOv3-attention方法与YOLOv3相比在人脸上的召回率有明显提高,网络检测精确度也进一步提升。(2)图像中人脸尺度不一,模型在大中尺寸的人脸上可以获得较高的检测精度,但是对于小人脸的检测效果不好。为了解决场景中小人脸的漏检问题,设计了一个提高低分辨率小人脸检测性能的检测模型SR-YOLOv3-attention。网络采用Dark Net53作为骨干网络,首先使用混合域注意力模块对模糊和小的人脸的输出特征进行处理,然后融入超分辨率重建模块对低分辨率的人脸进行数据增强,以此弥补浅层特征中不具有的高级语义信息,增强深层特征丢失的目标纹理信息。在WIDERFACE数据集上进行测试,SR-YOLOv3-attention在easy、medium和hard三个测试子集上的检测精确度分别为0.946、0.937、0.872,与其他人脸检测算法MTCNN、CMS-RCNN、HR和S3FD相比,在测试子集hard上测精度分别提高了0.243、0.229、0.053、0.013。实验结果验证了SR-YOLOv3-attention可以很好地利用人脸信息,有效地检测出图像中的难检测人脸,具有很好的鲁棒性。
其他文献
随着大数据成为国家基础性战略资源,许多企业和组织希望从海量数据中取得经济利益,并为用户提供便利。对于大多数企业和组织来说,他们没有处理海量数据的能力。因此,将数据挖掘任务外包给云计算服务机构有效地解决了这些企业和组织计算和存储容量不足、资源利用不足和资金投入等问题。但随之而来新的安全隐患,核心问题是数据所有者不希望自身敏感信息被别人知道。因此,隐私安全问题是海量数据挖掘技术应用的主要瓶颈之一。频繁
在大数据时代,海量多模态数据广泛存在,怎样通过模态数据间的互补学习来挖掘数据中隐藏的巨大价值,是现阶段大数据研究关注的主要问题。本文研究领域图像标题生成和视觉问题回答便是在寻找图像与文本这两种模态数据之间的桥梁。图像标题生成任务是让机器自动生成一个有意义的句子来准确描述该图像的内容,属于计算机视觉与自然语言处理的交叉领域。现有研究多通过卷积神经网络编码图像信息,循环神经网络解码生成文本信息,在此基
精神分裂症(Schoziphrenia,SC)是一种神经退行性疾病,患者在认知、记忆、情绪、运动感知等方面均有不同程度的障碍。SC患者的大脑信号异常,在结构和功能上发生的病变可能导致了其病理生理的失调。而目前,SC的诊断仍然主要依赖于患者的行为表现评分。由于对病因的认知不足,诊断方式相对单一等问题尚未解决,研究一种有助于诊断和治疗的生物标志有着重大意义。神经影像学的发展为研究精神疾病提供了更好的手
代码作者归属是识别给定代码作者的过程。随着越来越多的恶意软件和先进的变异技术出现,恶意软件的作者正在创造大量的恶意软件变种,寻找恶意代码作者身份的方法也随之成为热点。恶意代码中残留了显示作者风格的特征,这些信息可以帮助预测特定恶意软件的作者使用的工具和技术类型,以及恶意软件传播和发展的方式。代码作者归属技术可以用来识别和分类恶意软件的作者,选择较为明显的代码风格特征和更加高效的深度学习方法,对代码
计算机技术以及互联网技术在教育领域的持续发展受到了教育工作者及相关人员越来越多的关注,在线教育平台因其对时空界限的突破、对优质资源的整合等特征,自诞生以来就受到了各方关注。尤其是在2020年新冠疫情肆虐的背景下,在线学习更加被大众所熟知和使用。但与传统的教学形式相比,维持着庞杂信息的在线教育平台往往会因为缺少合适的维护而产生海量的信息碎片,在缺乏有效指导的情况下,学生的学习往往停留在较浅的层次,从
面对爆炸式增长的电子文本,人们所关心的是如何对这些数据信息进行智能化处理,并从这些文本中获取到用户真正关心的问题。在该背景下,信息抽取的概念被提了出来。事件抽取是信息抽取领域的一个子方向,同时也是该领域的一个研究重点和难点。传统的基于模式匹配的事件抽取方法需要手工的方式构建模式,这种方法耗费大量资源。基于特征的方法在提取特征的过程中会过度的依赖自然语言处理工具,这一过程也会耗费许多人力资源,而且还
造价管理是项目管理的重中之重,成功的造价管理能够给投资者带来最大的投资效益。准确的工程量作为计算工程造价的前提,是本文研究的重点。而BIM技术具有协调性、可视化、参数化等优点,同样可以为本文的研究提供技术支持。本文主要探讨了如何建立一种契合实际造价工作的标准化计量接口。尝试将建立标准化计量接口的问题转化为建立标准化计量模型的问题。提出将实际计量工作中所需的信息与基于IFC数据标准的BIM模型相关联
随着第五代移动通信系统5G技术的快速发展,全球已经进入大数据时代,用户已经不能有效利用海量互联网数据信息,“信息过载”问题日渐严重,推荐系统的出现一定程度上缓解了信息过载问题。推荐系统有效利用用户各种行为信息为用户建模,个性化地过滤无效信息。评分预测一直都是推荐系统领域研究的核心问题,其通过用户已有历史评分预测用户未知评分。虽然基于矩阵分解的协同过滤方法简单有效,但是经常受限于新物品新用户进入系统
胃癌是全球最常见的恶行肿瘤之一,由于癌症的异质性,胃癌的表型复杂多样,使得癌症的诊断和治疗十分困难,而且由于多数胃癌患者确诊时已处于癌症晚期,预后较差。因此,针对胃癌异质性的研究和个性化预后模型的构建对于胃癌患者治疗方案的制定和延长胃癌患者的预后具有重要意义。微卫星不稳定性(Microsatellite Instability,MSI)是由DNA错配修复受损导致的一种特殊癌症表型,研究表明,MSI
作为物联网的重要组成部分,应用于多个领域的无线传感网所产生的数据量与日俱增,对这类感知数据压缩的研究一直是物联网应用中最关键的技术之一。由于受到感知节点存储空间、电源能耗、计算能力等限制,如何在低能耗条件下满足应用需求来实现数据压缩成为亟待解决的难题之一。结合感知节点和基站特点,本文针对压缩感知理论处理时空相关性较强的一类感知数据的过程进行改进,实验结果表明本文的改进能够获得较好的压缩效果。论文的