深度卷积神经网络技术研究及其在人脸分析中的应用

来源 :厦门大学 | 被引量 : 0次 | 上传用户:wxcplayer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸分析是当前计算机视觉、模式识别和机器学习等领域的热门研究课题之一,得到了广泛的关注。人脸分析主要通过人脸图像来分析出人脸的各类信息,如:人脸身份、人脸表情、人脸年龄、人脸性别等。人脸分析在智能人机交互以及身份认证等领域中具有重要的研究意义和实际应用价值。但是由于人脸图像中存在着巨大的可变性,人脸分析问题面临着许多的挑战。另一方面,深度学习是近年来一个非常热门的研究课题,其通过大量的数据,自动地从数据中提取有效的特征表示,并用于后续的分类、回归等任务。这其中深度卷积神经网络已经在图像识别、语音识别、自然语言处理等领域展开了深入的研究并取得了良好的性能表现。因此,研究利用深度卷积神经网络技术进行人脸分析是一项既富有挑战又具有实际意义的工作。本文的主要工作具体如下:  本文首先广泛调研了现有的深度学习方法及分类,介绍了常见的几种深度学习模型,并着重介绍了常用的深度卷积神经网络方法,并综述了深度学习在人脸相关领域中的应用研究现状。  其次,本文分析了基于深度学习的目标检测方法,并讨论了将深度学习应用于人脸检测问题中。针对训练人脸分类器中样本选择等问题,本文提出了基于Bootstrap的深度学习人脸检测方法,在FDDB和AFW人脸检测评测数据库中,分别提高了2%和2.1%的检测率。  紧接着,本文系统地介绍了基于深度学习的人脸识别方法,并分析和比较在人脸特征提取中进行训练网络的各种方法的优点和缺点。在此基础上,我们提出了一种基于混合训练的深度人脸特征提取方法,将训练基于Triplet的深度模型的时间缩短到4天。并在多个任务中验证了本文提出方法的有效性。  此外,针对深度神经网络学习的特征具有从粗到细、从简单到复杂的特点,本文提出了一种基于多任务学习的人脸属性识别方法,在Adience数据库中,人脸年龄估计准确率从单任务的48.3%提高到51.4%,性别分类准确率由84.7%提高到87.6%,并在包括人脸微笑、人脸吸引力识别等多个任务中验证了本文提出方法的有效性。
其他文献
基于超图的半监督学习因其既利用了有标记数据样本的信息又利用了无标记数据样本的信息,近年成为一个研究热点,有很高的研究及应用价值,在图像处理、模式识别、语音识别等领域已
交通标志牌作为一种重要的交通基础设施,可以为驾驶员和行人提供道路指引信息,规范驾驶员行为的同时也起到了便利交通、保障安全的作用。道路交通标志检测作为智能交通领域的一
随着智能拍照手机的普及和互联网大数据的兴起,场景文本识别的应用越来越广泛,诸如移动翻译系统、车辆识别、多媒体检索、盲人导航等。最近几年场景文本识别受到了广泛关注,未来
近年来,采用P2P模式解决流媒体服务系统的瓶颈问题受到越来越多的重视。如何在充分利用P2P网络中众多节点资源的前提下,确保流媒体服务质量、提高播放的性能,成为P2P流媒体技
IDP(Integrated Data-Service Platform)是开放的、模块化的、基于标准的基础平台,它向下提供与短信网关、彩信中心、BOSS (Business & Operation Support System,运营支撑系
近年来,随着无线网络技术的飞速发展,各种无线技术在相互竞争的同时,也正在逐步走向互补融合。未来无线网络发展的趋势必然是在保留现有各种无线技术的基础上,提供一种统一的
基于上下文的自适应二进制算术编码(CABAC)是H.264/AVC标准的一种熵编码方案,与另一熵编码方式基于上下文的自适应二进制变长编码(CAVLC)以及传统的VLC基线熵编码方式比提高了
在电子商务蓬勃发展的网络环境下,越来越多的关于商品的主观性评论文本出现在各类购物网站上。这些评论文本中包含用户对产品各个方面的情感倾向,如喜欢、讨厌等。对其进行情
人脸特征定位及对应点匹配是计算机视觉和模式识别领域一个非常热门的研究方向,它是人脸识别、人脸动画、人脸跟踪、三维人脸重建、立体匹配以及建立统计模型等的前提步骤之
相比较传统全文搜索引擎,垂直搜索引擎可以为用户提供更专业、更准确的知识,避免用户在大量的数据中筛选与专业相关的知识,是搜索引擎的研究热点和发展趋势。目前垂直搜索引