【摘 要】
:
计算机技术发展以来,人机交互成为了计算机领域主要研究的内容之一。随着人工智能技术的快速发展,越来越多的人机交互成果被使用在生活中,同时驱动着机器视觉中与人脸相关的大量研究与应用,人脸表情是其中重要的组成部分。生成对抗网络(GANs)自2014年提出,被广泛应用在文本、图像等领域。学者们利用其优秀的生成能力进行人脸研究并且取得一些成果。但是近几年的研究发现,GANs在有限样本的情况下容易产生欠拟合,
论文部分内容阅读
计算机技术发展以来,人机交互成为了计算机领域主要研究的内容之一。随着人工智能技术的快速发展,越来越多的人机交互成果被使用在生活中,同时驱动着机器视觉中与人脸相关的大量研究与应用,人脸表情是其中重要的组成部分。生成对抗网络(GANs)自2014年提出,被广泛应用在文本、图像等领域。学者们利用其优秀的生成能力进行人脸研究并且取得一些成果。但是近几年的研究发现,GANs在有限样本的情况下容易产生欠拟合,无法取得好的生成效果。目前,公开数据集中亚洲,特别是中国人脸数据样本数量很少,这极大影响了亚洲人脸表情生成和重建的效果。针对小样本训练问题,学者提出了迁移学习的方法,即将在具有大数据集任务上学到的“知识”应用在不同但具有一定相关性的问题上。这在一定程度上,减轻了神经网络由于数据量不足而导致性能下降等问题,但在训练过程中,仍会因为样本数量有限而无法避免过拟合等问题。因此,只是简单的迁移学习并不能完全解决小样本带来的问题。为了解决这个问题,本文提出在生成对抗网络的基础上,引入迁移学习和特征图正则化相结合的方法,实现在有限数据中生成和重建表情。本文探讨现有的人脸表情生成和重建方法,对选用的生成对抗网络进行分析研究,阐述其图像生成和判别的原理和过程。然后针对亚洲人脸三维表情样本数量少、采集困难以及训练困难的问题,采取先进行二维表情生成、再进行重建的方法来生成最终的三维人脸表情。首先在GAN上利用Celeb A人脸数据集进行模型的预训练,采用卷积层低层权重冻结、高层权重微调的方式迁移至目标网络中,同时使用有限的亚洲表情数据集在迁移后的GAN进行训练以实现所需的人脸表情生成。在训练中加入特征图正则化作为辅助,以提升生成效果、减少过拟合;在GAN中分别加入辅助分类器来约束表情的生成。最后对生成图片进行预处理,输入三维重建神经网络,生成三维数据,建立亚洲人脸三维表情数据库。为了更好的展现生成效果,在Qt开放平台上设计人脸表情二维与三维的生成效果演示系统。
其他文献
近年来,随着我国经济的快速发展和交通的日益便利,我国汽车保有量呈指数级增长,行人出行的风险也在逐步上升。在我国城市道路交通监控系统中,有大量实际的城市道路交叉口路段监控视频。通过交叉口断面监控视频,可以了解道路交通和路况信息。但是它无法实时判断道路的交通状态,使拥堵等异常事件演变成更为复杂的事件,最终导致交通压力急剧上升,从而影响正常交通。因此,本文针对我国城市道路交通监测压力愈加严重的形势结合城
同时定位与构图(Simultaneous Localization and Mapping,SLAM)是指运动物体在环境中根据传感器的测量信息,解算自身位姿时,同步构建环境地图的过程。SLAM作为导航和感知的关键技术受到了广泛地关注,已经在航空航天、交通运输、物流仓储等领域得到应用。目前,如何实现高精度、强自主、抗干扰能力强的定位与构图是SLAM技术研究的重点和难点问题。针对传统SLAM方法中自主
随着国内社会老龄化程度地加重,人体健康问题也越来越突出并逐渐引起重视。常言道“人老腿先衰”,膝关节的健康状况紧密联系着人们的运动机能从而影响日常生活。传统穿戴式评估膝关节健康的方式存在依赖医学设备、穿戴复杂、非医务人员操作困难等问题。针对传统监测手段缺陷,利用光学原理提取关键信息并建立膝关节运动模型,开展膝关节健康监测的非接触式技术研究具有应用价值和研究意义。论文的主要工作和创新性如下:(1)基于
心率是衡量人体健康状况的重要指标之一,非接触式心率测量方法相比于接触式心率测量方法具有一定的优点。非接触式心率测量依赖光电容积脉搏波描记法(IPPG),通过摄像头拍摄人体皮肤提取血液容积脉冲(BVP)信号,实现心率的测量,适用各种复杂场景。在非接触式心率测量中,盲源分离是一种广泛采用的提高心率测量精度的手段,开展联合盲源分离的非接触式心率测量技术研究具有重要意义。论文的主要工作及创新如下:(1)针
随着大跨度、超高层建筑的发展,以及装配式建筑的兴起,越来越多的建筑采用钢结构形式。其中冷弯薄壁型钢因具有质量轻、截面型式多样及拼装便捷的优点,得到日益广泛的应用。而拼合截面冷弯薄壁型钢组合柱则是通过铆钉将C型钢和钢板拼合到一起并灌注混凝土,增强了组合柱的承载能力和稳定性。本文采用试验研究和理论分析相结合的方法,针对拼合截面冷弯薄壁型钢组合柱的力学性能进行研究,为该类构件在工程中的应用提供支撑。通过
近年来,网络化的状态估计因具有低成本、远距离传输、高可靠等特点被广泛应用于智慧交通、物联网等领域。目前,网络化的状态估计面临通信带宽有限、量测数据丢失和存在外部输入等问题。传感器能量有限、器件老化、网络拥塞等原因易引起数据传输过程中能耗高、量测数据丢失与不连续等问题,导致状态估计性能下降。现有网络化状态估计方法大多基于高斯分布建模量测噪声,但在实际系统中,由于量测野值、建模误差等原因导致量测噪声呈
随着地铁数量的不断增加,地铁车站工作人员和乘客的舒适性和安全性越来越受到人们的重视。对于地铁站内的环境状况进行分析和预测已成为决策和行动的重要依据。传统的点预测方法的输出结果是未来一段时间内的环境参数的具体数值,如果预测模型输出的结果是基于不同置信度的概率值而不是精确数值的话,可能更接近实际情况的要求。因此,本文提出了基于自回归长短时记忆(LSTM)神经网络的地铁车站环境参数概率预测方法,对地铁车
随着人工智能的崛起,人机交互操作系统已经在很多领域广泛应用,尤其是要求精准度和高危的领域,例如:空中交通管理系统,飞机驾驶系统和深海潜行系统等。操作人员在执行任务时需要具备良好的工作状态,分析脑力负荷水平,可以判断其脑力负荷状态,保证人员安全和任务有效执行。因此通过判断操作人员脑力负荷状态并对其进行准确辨识很有意义。常用的脑力负荷辨识方法是基于脑电信号(electroencephalogram,E
近年来,随着深度学习的发展,其在各个领域都应用广泛。但在实际中,深度学习仍存在许多问题。首先获取一个性能良好的深度学习模型需要大规模的标记样本对其进行训练,但是给样本做标注的过程既浪费时间又浪费劳动力。其次,深度学习模型使用当前场景下的数据进行训练和测试的效果较好,但是当测试数据与训练数据存在分布差异时,深度学习模型的泛化能力明显下降。这就导致要花费大量人力物力重新标注样本,并对模型再次进行训练。
圆周扫描地基SAR是将机载圆迹SAR模式引入地基平台的一种新体制地基SAR,与传统的直线轨道地基SAR相比,其具有三维成像能力、单次数据采集时间短、滑坡监测时效性强等优势。近年来,研制具备三维成像能力的地基SAR系统已成为一个国际研究热点。作为一种全新的地基SAR模型,圆周扫描地基SAR仍处于刚起步的阶段。目前,国际上已经验证了利用该模式三维成像的可行性,但其三维成像质量与实际应用中的成像质量要求