【摘 要】
:
人脸识别技术在当前已经得到广泛应用,在一些限定场景下已较为成熟。然而,该技术仍然存在一些缺陷,主要表现为目前大部分人脸识别产品对姿态有着较高的要求,需要用户配合主动调整自身姿态至正面才能获得较好的识别效果,这极大限制了该技术在更大应用场景进行推广。因此,多视角人脸识别技术在许多非用户配合的应用场景具有重要意义。针对上述问题,本文展开了多视角人脸识别技术的探索,研究并实现了一种基于三维可形变模型的人
论文部分内容阅读
人脸识别技术在当前已经得到广泛应用,在一些限定场景下已较为成熟。然而,该技术仍然存在一些缺陷,主要表现为目前大部分人脸识别产品对姿态有着较高的要求,需要用户配合主动调整自身姿态至正面才能获得较好的识别效果,这极大限制了该技术在更大应用场景进行推广。因此,多视角人脸识别技术在许多非用户配合的应用场景具有重要意义。针对上述问题,本文展开了多视角人脸识别技术的探索,研究并实现了一种基于三维可形变模型的人脸旋转技术,可以对较大姿态侧面人脸图片进行正面化对齐处理来降低对人脸识别的姿态要求。本文主要工作总结如下:1)基于轻量级网络和附加角边缘损失函数训练人脸识别模型,并通过评估实验探究了网络容量、人脸姿态变化等因素对模型评估精度的影响,实现了一个性能较高的轻量级人脸识别模型;2)研究并实现了一种基于三维人脸重建的人脸旋转技术以改善人脸识别受限于姿态变化的问题。通过一种旋转和渲染框架以实现单张人脸图片的自监督,解决了多视角成对人脸数据难以获取的问题,同时避免了在特定数据集上训练存在的过拟合问题;设计并训练了生成式对抗网络,可以生成身份信息得到较好保留的逼真人脸图片;并通过实验证明,该方法与相关同类方法相比取得了较好的身份信息保留性能,并基于融合距离度量直接验证了该方法的有效性;3)将人脸旋转技术应用于真实场景中的侧面人脸正面化对齐过程,设计并实现了非用户配合场景的面向盲人社交的多视角人脸识别系统,降低了对姿态的要求。
其他文献
现如今人工智能伴随着机器学习和深度学习等相关技术的快速发展,已经在日常生活、工作中处处发挥着便利我们的作用,但是智能机器进一步认知人类世界离不开对知识的理解。知识图谱以结构化的形式存储着数据知识,用于描述客观世界中的抽象概念、命名实体以及相互关联关系。知识图谱构建质量依赖于实体关系抽取的性能。目前基于深度学习的实体关系抽取模型依赖于大量的标注数据,而真实应用落地场景中少样本类别所占比例较大,数据长
极细粒度实体分类任务旨在为文本中的命名实体做类别划分,是信息抽取中的关键任务,更细的类别划分能为信息抽取提供更丰富的语义内涵,该技术也是信息检索、问答系统、知识图谱、文本挖掘等下游任务的重要支撑。作为关键任务,极细粒度实体分类需要消除语义上的歧义,根据实体(专有名词)的上下文自动、快速地发掘合理且准确实体细粒度类别含义。极细粒度实体分类由于类别多(超过一千类),标注极为困难因而鲜有标注数据,只能通
工业数据是工业企业的重要资产,有效利用工厂的生产、管理和运营数据可以帮助企业更好地实现精细化管理,但目前流程工业企业信息系统种类繁多、数据类型多种多样,多元数据管理不规范、数据分析门槛高,无法真正实现对数据价值的挖掘。本文以对象化建模技术、数据融合加工技术、大数据分析与挖掘技术为关键技术,结合流程工业企业数据特点以及行业知识,采用对象化建模技术对流程工业不同类型数据进行对象化编排,通过数据融合加工
在自然语言处理中,命名实体识别是许多任务的上游,它为诸如信息检索、智能对话和阅读理解等任务打下了根基。虽然近年来深度学习模型在实体识别这个任务上的进展表明,该任务似乎已经不是一个难点,但是由于深度学习模型对大规模标注数据的依赖导致了命名实体识别任务也通常需要海量数据才能有好的效果。这种缺陷在许多场景下会成为一个致命的缺点,比如在医疗领域,由于隐私保护的原因,我们很难获取到大规模的标注数据。本文针对
大数据的兴起促进了数据规模的突飞猛进。数据库中往往存储了大量高价值的数据,以往用户想要查询数据库内容时,需要编写结构化查询语言SQL,再与数据库交互,这给非专业领域的普通用户带来了不便。而且对于一些复杂的查询条件,手工编写SQL时容易出错。如何通过自然语言自由地查询数据库成为新的研究热点。据此,本文提出了基于显式关系编码和抽象语法树解码的Text2SQL系统,可以端到端的将自然语言转换为SQL序列
智能音箱以人工智能为基础,以语音代替点击作为主要的人机交互方式,是新一代的互联网硬件产品。随着智能音箱用户量的急剧增加,企业获取了大量的用户与音箱的交互数据。本文基于海量用户与音箱的交互数据来构建智能音箱用户画像,并介绍用户画像的系统架构及应用。智能音箱用户画像的构建首先是对用户相关属性进行分析,根据业务需求将智能音箱用户画像属性分为用户自然属性、生命周期属性、行为指标属性和用户技能属性。对属性进
目前,以太坊作为区块链技术2.0的实现,具有去中心化、不可篡改等特点,其应用开始遍布各行各业。智能合约可以运行在以太坊上并在一定条件下自动触发,但是已有的智能合约研究都集中在安全问题上,对于编程友好性的研究很少。现有的智能合约编写环境良莠不齐,大概分为两种,一种是直接操作命令行,这样的方式操作复杂且容易出错,另一种是通过图形界面开发,但是已有的平台无法达到高效易用的要求。这些问题无形中拔高了区块链
随着制造业与数字化不断融合,汽车制造行业对数字化、信息化的需求越来越旺盛,但是一些汽车制造行业现有的制造执行系统(MES)仍然存在着不少的弊端。为了解决企业中现有MES系统存在的问题,本文设计并实现了动力总成关键指标目视化系统,并运用微服务架构解决了传统单体架构中存在的耦合度高、灵活性低、维护困难等问题。本文通过微服务的思想将系统拆分为大屏展示、看板展示、数据填报、系统管理、主数据维护5个功能模块
随着手机市场竞争的加剧,各品牌越来越重视手机质量,赢得消费者口碑,占据更大的市场份额。手机外观清洁与检测作为手机封装前的工序,对最终流向市场的手机有着非常重要的筛选作用,防止外观脏污或者有缺陷不良的手机流入市场,影响用户体验。现有手机清洁方式主要依靠人工手动擦拭,耗费时间长,清洁效果不一;其它清洁装置多为单一产品的擦拭,去污能力有限;使用无尘布的方式易造成布屑二次污染,且材料无法循环使用,成本较高
三磷酸腺苷结合盒式转运蛋白(ATP binding cassette, ABC)是目前发现的最大的膜蛋白家族之一,广泛分布于从细菌到人类等各种生物体中,每个成员都含有两个高度保守的ATP结合区(ATP binding cassette),可通过结合ATP发生二聚化水解释放能量,并形成一个跨膜通道从而实现多种底物的跨膜转运。可转运的底物包括:无机离子无机酸、氨基酸、脂类、糖类、多肽、各类药物、细胞代