【摘 要】
:
得利于深度学习的发展与大规模训练数据的积累,最近几年人脸识别技术取得了巨大的成功。其中,传统的二维人脸识别技术通过对人脸的纹理数据进行特征表达,并通过判断特征间的相似度对人脸进行身份确认。人脸姿态、妆容,特别是环境光照对获取到的二维纹理信息有着较大的影响,进而影响二维人脸识别算法的识别性能,也限制了二维人脸识别系统的应用场景。三维人脸识别技术使用人脸的三维深度信息对人脸身份进行鉴别。这使得三维人脸
【基金项目】
:
研制于2013年10月至2018年9月的国家重大科学仪器设备开发专项“高速高精度结构光三维测量仪器开发与应用”项目,项目编号为2013YQ490879;
论文部分内容阅读
得利于深度学习的发展与大规模训练数据的积累,最近几年人脸识别技术取得了巨大的成功。其中,传统的二维人脸识别技术通过对人脸的纹理数据进行特征表达,并通过判断特征间的相似度对人脸进行身份确认。人脸姿态、妆容,特别是环境光照对获取到的二维纹理信息有着较大的影响,进而影响二维人脸识别算法的识别性能,也限制了二维人脸识别系统的应用场景。三维人脸识别技术使用人脸的三维深度信息对人脸身份进行鉴别。这使得三维人脸识别的方法可以很好地规避二维人脸识别的上述缺点。如何快速准确地对人脸数据进行三维重建,同时完成对三维人脸识别算法模型进行有效约束优化是三维人脸识别技术及其应用亟待解决的问题。本文面向人脸的三维重建,针对门禁类应用场景构建高精度高防伪三维人脸识别算法进行了系统的研究。本文的主要工作和创新点包括:1.设计实现了基于条纹结构光的三维人脸重建算法以及与之对应的三维人脸照相机系统。在人脸识别系统的应用过程中二维人脸技术极易受到环境光照、人脸姿态等客观因素的影响,导致识别性能下降。仅使用人脸深度信息的三维人脸识别技术可以很好地规避二维人脸识别的这些劣势。快速准确地获取三维人脸数据是三维人脸识别的前提。高速高精度三维人脸照相机能够为三维人脸识别技术与应用提供数据基础;2.人脸识别应用中,人脸误识问题就是样本特征的类内距离大于类间距离的问题。为了最大限度地减小类内距离,降低人脸识别误识概率,提出了Improve-Center人脸识别监督方法。该方法基于每个身份的人脸样本形成的特征子空间,通过增加子空间外层样本对模型优化的贡献,最小化类内样本之间的特征距离,提升算法的识别性能。3.传统的人脸识别算法通过样本对的方式组织训练数据。这样,模型的优化过程中仅仅利用很小部分的相关信息对模型进行优化。这种过于局部化的监督信息可能导致类内特征分布不均衡,类内样本中不同特征之间的相似度差异较大。基于所有类内样本特征组成的特征子空间形成的空间中心,提出的Cosmos-Loss损失函数在对模型进行优化的过程中,使用样本特征与特征中心之间的监督信息完成该样本的类内以及类间监督,提升了人脸识别性能与类内特征数据分布均衡性。4.针对门禁应用,基于Improve-Center与Cosmos-Loss两种监督函数提出了高精度高防伪三维人脸识别算法,实现了高识别率的人脸识别方法。通过对训练数据进行双向数据增广的方式提升了算法对3D打印面具的防伪能力。此外,提出了基于双目人脸防伪以及多光谱人脸防伪方法,以增强人脸识别系统的防伪能力。最后,针对佩戴口罩的特殊应用场景设计实现了口罩版人脸识别算法。
其他文献
由于互联网多媒体技术的快速发展、智能手机的广泛使用以及社交网络的不断普及,人们能够随时随地在互联网上分享有趣的内容,使得互联网上不同模态的多媒体数据(如文本,图像和视频等)呈现爆炸性增长、海量性集聚的特点。如此大规模的数据标志着多媒体大数据时代的到来,同时给基于多模态学习的研究和应用带来了新的机遇和挑战。随着以深度神经网络为代表的人工智能技术的迅猛发展,如何基于深度神经网络模拟人类大脑的认知和理解
深度学习又称为深度神经网络,是人工神经网络的一种,是一种通过堆叠多层非线性变换方法对高复杂性数据进行建模的算法。在图像处理领域,深度学习主要是指深度卷积神经网络(Deep Convolutional Neural Networks,简称DCNN)。人工神经网络的概念自上个世纪四五十年代被提出以来,几经发展和沉寂,在本世纪初又开启新一轮发展热潮,展现出强大的生命力。图像目标检测的目的是判断图像中是否
计算机科学融合音乐学并推动音乐学自动化智能化发展催生了两个大的研究方向:音乐信息检索和音乐生成。其中,音乐检测是音乐信息检索领域的一项关键任务,它聚焦于研究如何从音频中检测出音乐事件及发生的位置;音乐生成是人工智能在艺术创作方面的一项探索,它关注于研究能让计算机自动进行音乐创作的算法。随着数字音乐数量的与日俱增,神经网络方法善于学习海量数据以及具备强大建模能力的特点使其成为近年来音乐检测和音乐生成
三维图形绘制在游戏娱乐、虚拟现实、科学计算可视化等众多领域有着广泛应用,而且在实时和真实方面的绘制要求越来越高。近年来,软硬件的计算性能得到了很大提升,但是面对数据规模的日益增长,大规模数据的实时绘制面临巨大挑战。本文主要针对体数据和地理地形数据的真实和实时绘制技术展开研究。对于精度高、体量大的体数据,三维可视化计算量大,同时增加光照计算更加重了计算负担。大规模地理地形数据一直存在如何高效处理和绘
神经科学研究证明,生物神经网络之间的细胞是通过神经元的动作电位(发放的脉冲)来进行相互通信的。因此,更具有生物可塑性和强大信息处理能力的第三代神经网络:脉冲神经网络(杓杰杩杫杩杮杧李来杵杲条杬李来杴杷杯杲杫,杓李李)受到了研究者的广泛关注。与传统的基于频率的神经网络不同,杓李李能够处理和提取脉冲信号中编码的时间动态特征,从而使其更加具有生物可塑性,且计算能力更强,功耗更低,在未来的移动智能领域具有
近年来,以软件代码为载体的网络安全问题频频发生,软件代码同源判定作为解决网络攻击溯源等安全问题的共性关键技术变得尤为重要,准确定位软件代码来源已成为各方关注的焦点。由于当前软件代码具备运行平台多样、变形手段繁多、表现形式复杂等多形态特点,导致其同源判定极为困难。如何有效的发现多形态软件代码同源,对增强我国网络空间安全的防护力、威慑力至关重要。面向多形态软件代码的同源判定,首先需厘清软件代码同源的概
随着多媒体技术、网络技术的发展,多媒体数字产品的复制与传播变得非常便捷。相应的,盗版行为也日益猖獗,给版权商带来了不可估量的经济损失。因此,急需有效的版权保护措施来遏制盗版行为。在这一背景下,学者们提出了数字水印技术,经过近年来的快速发展,已成功应用于多媒体数字产品的版权保护,挽回了盗版带来的经济损失。因而,研究数字水印技术,进一步提升其版权保护效果,是一项具有重要理论意义与应用价值的工作。音视频
在国家大力发展人工智能和“健康中国”的时代背景下,以人工智能为核心的智能医学被看作是未来医学的重要发展方向之一,同时也是多学科交叉的高尖科技。医学图像的精准分析是智能医学在科学研究、临床诊断和治疗中关键所在。丰富的影像资源使眼科成为了最适合开展人工智能诊断的一个研究领域,展现出广阔的临床应用前景。本文响应“十三五”眼健康规划,研究了眼底病变智能诊断的深度卷积神经网络方法,建立了糖尿病视网膜病变识别
肺癌与结直肠癌是当今致死率较高的两大恶性肿瘤,且常以肺结节及肠息肉形式作为其早期可能性表征。肺结节与肠息肉分割作为性状判断、体积度量、倍增速率跟踪等关键步骤的基础,能够为疾病分析及治疗提供可靠的数据支持。同时,准确的病灶分割结果还可以提升病灶特征提取、良恶性判断、三维重建及可视化等图像处理方法的精准程度。因此,无论是从提高医疗信息化水平的角度,还是从推动医学图像处理领域相关研究发展的角度,针对肺结
伴随深海探测技术的发展,我国提出了走向深蓝的战略布局。深海潜水器及相关装备是进行深海科学研究、环境检测和探索开发的必要装备。随着深海潜水器技术的不断发展,深海环境模拟技术与装置在深海潜水器的试验验证、改进升级等工作中的重要性越来越凸显。2012年,我国自主研制的“蛟龙”号载人潜水器成功完成水下7000m海试,工作压强为70MPa,使我国成为继美国、法国、俄罗斯、日本之后世界上第五个掌握大深度载人深