深度人脸检测与三维重建方法研究

来源 :中国科学院大学(中国科学院深圳先进技术研究院) | 被引量 : 0次 | 上传用户:durrenchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于图像的人脸分析是计算机视觉中非常重要的任务,它可以广泛应用在日常生活中,比如刷脸购物,影视动画,医疗美容等等。而人脸检测是人脸分析的非常重要的一个任务,所有人脸分析任务的前提条件是从图像中检测出人脸。而人脸分析中需要处理的大姿态、模糊、遮挡等条件人脸对于人脸检测任务一直是该领域内的难题。所以在本文中,先对这些挑战条件在人脸检测中的难题进行探索研究。对于人脸分析,三维人脸提供了不受光照和姿态影响的几何和纹理信息,而现有的基于硬件的三维人脸采集方式应用受限制,本文中我们提出基于单张图像的三维人脸形状,纹理重建。对于人脸检测,近年来由于深度神经网络以及高质量训练数据的出现,性能得到了大幅度的提升。但是小尺寸、大姿态、遮挡人脸对于基于深度学习的人脸检测模型仍然非常具有挑战性。为了处理挑战条件下人脸检测,我们在本文中对检测框架中最核心的两部分:候选框生成和分类器分别进行了改进提升。为了提高候选框生成的质量,我们提出增强候选区域网络,该网络挖掘深度卷积网络图中的位置信息,能够大幅度提升困难条件下人脸检测性能。为了提升分类器的性能,我们提出在线困难候选区域挖掘用于训练,在测试过程中并无额外开销。除此之外我们还提出了离线困难图片挖掘进一步提升分类器的性能。我们的方法在公开数据集FDDB、WIDER FACE、Pascal Faces以及AFW上均取得当时先进的性能。从图像中检测人脸之后,开始进行人脸三维分析,我们在三个方面进行了探索研究:(1)三维人脸细节重建,(2)三维人脸纹理重建以及(3)三维人脸纹理形状联合重建。在(1)三维人脸细节重建的任务中,从单张图像中重建出人脸三维细节非常具有挑战性,因为它本身是一个病态问题。基于参数化统计模型的方法因为其低秩的性质,无法重建三维人脸细节信息。而基于阴影恢复形状的方法严重依赖于初始形状,并且受到光照的影响。同时,对于深度模型来说,目前缺乏公开可以用于训练的高质量RGB-D数据。为此,本文提出一个三阶段的由粗糙到精细的DF~2Net深度模型。本文在深度网络中用自监督的训练方式从输入RGB图像中挖掘三维细节信息。在数据方面,我们用生成的方式获得可以用于深度模型的高质量数据库。我们在公开的数据集BU-3DFE进行定量分析和定性分析显示出我们的方法比当前先进算法表现出更加鲁棒和准确的细节重建能力。目前学术界更加关注的更多的是形状重建,对于(2)三维人脸纹理重建任务而言,目前依然是一个充满挑战的任务。首先,现阶段学术界缺乏公开真实感三维纹理训练数据库,从而导致目前主流的方法是基于统计模型的纹理重建。而基于统计模型的纹理重建,由于低秩表达能力的限制,重建纹理与输入人脸相差较大。在本论文中,我们在缺乏三维人脸纹理训练数据的情况下,用非统计模型的方式直接重建每一个顶点的三维纹理。为此,我们提出一种新颖的基于多视角自监督的深度学习架构,用来从单张图像中重建三维人脸纹理。为了重建出高质量的三维纹理,我们提出了一种新颖的多视角一致性损失函数。本文方法在Celeb2,Multi-PIE,Vox Celeb2等公开数据集上都取得了先进的性能。最后本文联合三维形状与纹理进行重建,以获得更加丰富的信息。对于(3)三维人脸纹理形状联合重建,目前人脸三维重建方法对于三维形状和输入二维图像的对应(2D-3D Correspondence,简称2D-3D对应)做的并不好,这限制了它在纹理重建,密集关键点定位等领域的应用。原因在于通常的基于低秩表达的方法(例如三维形变模型方法,简称3DMM)用几百维的参数去表示几万个顶点的位置,导致了2D-3D对应存在非常大的误差。同样,目前基于密集表达的方式因为其训练数据来源于统计模型,所以它依然是一个低秩表达的方式。因此本文提出一个深度形状重建与纹理填充网络(Shape Reconstruction and Texture Completion Network,简称SRTC-Net)。在SRTC-Net框架中,我们首先用一个对应网络(Corresponding Network,简称C-Net)把复杂的2D-3D对应问题分解为两个更容易处理的子问题:前景背景分割与投影归一化位置编码(Projected Normalized Coordinate Code,简称PNCC)回归的问题。有了准确的2D-3D对应,能重建出高质量的人脸纹理,并且从该纹理中挖掘三维细节结构信息。我们首先在Multi-PIE数据集中验证了我们的方法与当前前沿方法相比,能更加准确的预测2D-3D对应。此外本文重建出的纹理能大幅度提升大姿态人脸识别任务性能,在Multi-PIE,CFP公开数据库上均取得了先进的结果。在定性分析中,本文重建出的三维人脸比低秩表达的方法能重建出更多的细节。
其他文献
【目的】盘状结构域受体1(DDR1)是酪氨酸激酶(RTKs)家族的跨膜胶原受体,在上皮细胞中被胶原激活。在肝脏发生纤维化的情况下,DDR1可通过机械重组重建胶原排列。同时,在胶原结合的作用激活下,DDR1发生裂解,随后大量胞外端脱落到血液中。纤维化的肝细胞周围细胞外基质中有大量胶原沉积,由此激活脱落的胞外端DDR1作为细胞外脱落的产物是否可以在血清中检测到,并且作为血清标志物来诊断和肝评估纤维化尚
信息时代的一大重要特征就是数据的爆炸式增长,这使得通过一次性的数据载入进单个超级计算机或者工作站从而进行处理和提取有用的变得越来越困难。如今,越来越多的分布式存储和计算架构,如Hive,HBase,Hadoop,Spark等,得到了企业界的青睐并逐步地投入实际生产中且已产生巨大的效益。与此同时,基于数据流的处理方案,在多个方面占据优势,例如仅仅只需在整个数据集上的一次遍历,对本级计算机的低要求以及
金属-有机框架化合物(Metal organic frameworks,MOFs)是一种新型的由金属离子和有机配体组成的有机-无机杂化材料。自发现以来,MOFs材料由于其具有丰富的功能点位、结构可设计性强、对外界的刺激敏感的性质,从而在离子传感、气体吸附及贮存、发光、磁性、生物医药等领域有着非常巨大的应用前景。由于稀土离子具有较高的色纯度、可见光发射、较大的斯托克斯位移和发光寿命相对较长的f-f跃
近年来,异构系统硬件飞速发展,如何更高效的开发面向异构众核平台的并行程序成为制约异构系统发展的关键因素之一。我国自主研发的超级计算机“神威·太湖之光”采用国产众核
数据表明,约40%的液压泵马达成本源于其铸造类零件,因此对铸造类零件的本地化成为制造业跨国公司降本增益的关注点之一。作为某跨国公司在中国液压行业的一个小分支的X公司,面临近年来经济萎靡、行业竞争加剧等多重不利因素,迫切需要尽快实现其所生产的十几种液压产品、涉及几百个铸造类零件的本地化采购。根据历年来X公司铸造类零件本地化的数据,其项目进度延迟已成常态。究其原因,主要还是项目进度计划不符合项目实际从
嵌入式系统已经深入到人们日常生活中的各个领域,面对越来越复杂的嵌入式应用需求,在嵌入式领域的一些特殊应用场合,给嵌入式系统提出了更高的要求。针对需要在线维护更新、不宕机修复异常程序、安全高效的嵌入式系统现实需求,出现了一种基于Forth虚拟机的嵌入式多任务操作系统。系统采用基于F orth虚拟机的已知调度时机和调度点的协同式多任务调度算法,基于Forth虚拟机的抽象,使得任务上下文切换精简到只需要
本文拟从武侠、狐鬼、爱情——林纾小说的三大主题入手,探究中国古代文学传统与翻译实践在林纾小说创作中起到了怎样的作用。林纾的武侠书写以辛亥革命为界线,分为前后两个阶段。民国以前创作的《技击余闻》重“武”轻“侠”,之所以呈现这样独特的面貌:从创作背景来说,迎合了晚清的“尚武”风潮;从创作动机来说,受其翻译的《剑底鸳鸯》等小说的启发;从作品形态来说,则继承了段成式《酉阳杂俎》的创作精神。民国期间创作的武
随着大数据时代的到来,容错存储系统中的纠删码技术因其较低的存储开销和较高的容错能力受到了越来越多的关注,而其中数据的重构效率是纠删码难以广泛应用的瓶颈所在。目前,
有限元网格生成属计算力学与计算几何学的交叉研究领域,曲面网格生成是其重要的一个分支领域。在复杂曲面的网格生成中,往往会产生一些形状质量低、拓扑有缺陷的三角网格,需
超声波具有穿透力强、传播方向良好,并且不会有明确的衍射,快速而又高效的特点,并且最重要的在于对人体无害,所以进行三维成像方面上在医学领域受到青睐。在工业方面上,超声成像主要研究热点在于无损检测领域,检测物体内部缺陷。针对于表面轮廓线进行成像研究中,重建三维点云数据模型上鲜有人研究。本文中通过超声合成孔径聚焦成像技术对物体表面轮廓线进行成像,将获取的矩阵数据转换为点云数据,根据探头的移动轨迹确定坐标