人脸表情自动提取与跟踪技术研究

被引量 : 0次 | 上传用户:lmj1103
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从视频中自动提取并跟踪人脸表情具有重要的科研意义和广泛的应用价值。人脸和表情是婴儿出生后需要首先辨识的视觉模式,因此研究人脸表情的自动提取技术对于理解人类视觉系统的原理具有重要的指导意义。表情的自动提取和跟踪技术还是基于视频的表情动画,人脸识别和表情分析系统的基础。其中基于视频的表情动画系统可以从视频中捕捉真人表情并驱动虚拟人脸做相似的表情,这对数字娱乐和影视特技行业具有广泛的应用价值;人脸识别系统是一种重要的智能安检手段,在反恐保安领域获得了日益广泛的应用;表情分析系统可以让计算机感知用户的情绪并提供智能化的服务。本文研究对于神经科学、数字娱乐、反恐保安和智能人机交互具有重要的意义。视频中的表情变化一般是通过定位和跟踪人脸特征点来捕捉的。但由于人脸表情和头部姿态的变化,很难对特征点的形态进行准确建模;此外视频中的光照不均匀且人脸上往往还有眼镜和胡子等遮挡物,因此小小的特征点很容易淹没在这些干扰中而不易被检测到。已有的特征点定位和跟踪技术需要诸多限制条件,比如均匀的光照、正面人脸等,这些限制条件使得相关技术难以在实际中得到应用。本文的研究目标就是提高人脸特征点定位与跟踪方法的效率和鲁棒性,并快速准确地提取人脸表情。本文工作的创新点总结如下:1、提出了一种鲁棒的人脸特征点定位方法传统的积分投影法只能对均匀光照条件下的正面无偏转人脸进行特征点定位。本文提出了人脸特征点定位的定向投影法,它能够对姿态变化的人脸实施特征点定位。其中包括两项主要创新:1)设计了一种基于主元分析的人脸姿态估计算法,通过对偏转人脸进行姿态估计和校正,使积分投影法得以应用到头部有平面内偏转的情况;2)提出了噪声投影峰识别方法,通过鉴别并剔除噪声投影峰,提高了积分投影法对光照条件的容忍度。2、提出了两种人脸检测和特征点定位融合方法人脸检测和特征点定位一直被认为是两个彼此独立的研究课题。因为前者的研究对象是人脸,而后者的对象是面部特征点,它们在尺度、数目和形态上差别很大。因此已有的人脸检测和特征点定位方法分别采用不同的计算模型,运算过程中也没有交集和合作。针对这一问题本文分别提出了两种人脸检测和特征点定位融合方法。应用这两种方法,人脸检测和特征点定位不再是彼此独立的,而是共享同一组输入特征,使计算效率得到提高。另一方面这种融合技术与视觉神经的运作机制具有一定的相似性。在大脑中存在向前传递和向后映射两条视觉神经通道,其中向前传递通道能够快速检测识别对象,其功能类似人脸检测算法;向后映射通道能够鉴别物体细节,其功能类似人脸特征点定位算法。这两个视觉神经通道都建立在V1/V2视觉皮层信号基础上,因此它们之间的合作关系很类似在我们混合算法中的人脸检测和特征点定位间的关系。所以本文提出的算法为这两条视觉神经通道提供了可行的计算模型。3、提出了一种平滑有约束的表情跟踪技术表情跟踪结果通常不够平滑伴有小幅频繁的抖动。这是因为在表情跟踪中需要对很多参数进行优化计算,比如头部在三维空间的平移和旋转参数,嘴巴、眼睛和眉毛的运动参数。在高维参数空间内进行计算会遇到“维度灾难”问题,即计算复杂度随着维度的增加呈指数级递增。针对这一问题,本文在提出了一种新的表情跟踪技术,它能够实现平滑的表情跟踪而且通过对跟踪结果进行约束,提高了跟踪精度。其中的创新点:1)通过非线性降维减少了计算复杂度;2)对头部姿态和人脸表情分别采用不同的策略进行跟踪,并且通过加入先验约束来降低跟踪误差。4、提出了一种能够进行错误矫正的表情跟踪方法提出了一种能够进行错误检测和矫正的表情跟踪方法,我们称其为“隧道隐变量法”。它建立在第6章所述方法的基础上,创新点:1)通过对隐变量分布进行聚类分析把隐变量空间分割成若干跳转候选区域。2)建立了跟踪误差与跳转候选区域的概率模型,这个概论模型可以帮助我们确定合适的采样区域3)在跟踪过程中若发现误差持续超过某一阈值,就根据上述概率模型选择跳转区域,进行有侧重的大跨度采样,然后选择误差最小的子区域中进行后续的跟踪。这个方法仿佛在隐变量空间的不同地点挖通了“隧道”,使跟踪变量可以瞬时迁移和跳转,进而克服了跟踪中的局部收敛问题并实现了错误的检测和矫正。综上所述,本文针对从视频中提取并跟踪人脸表情开展研究,研究内容涵盖了人脸特征点的定位和跟踪技术。应用本文提出的创新技术我们开发了一套基于视频的表情动画系统,该系统能以近实时的速度从视频中提取真人表情并合成三维虚拟人脸表情动画。
其他文献
本文通过人工湿地对农村富营养化水体中污染物去除性能和规律进行的小试和中试试验,对湿地植物的生长特性及其吸收氮磷的特点、湿地基质微生物数量分别与碳源代谢等进行了较为
疏浚主要利用挖泥船开挖水下土石方,以达到疏通河道、浚深港池和锚地水域等目的。文章对挖泥船的类型和其施工方法、泥浆的输送及泥土的处理进行了阐述,并系统的对其进行了分类
球形电动机的研究近年来受到了广泛的重视,原因在于它的球形结构可以在空间的任意点处进行定位、工作,尤其是用于仿人型机器人的肘、肩关节和手臂的运动控制中时,有着不可比拟的
改革开放以来,特别是近年来,我国政府积极运用宏观经济政策,加大了基础设施的资金投入,促使了诸多的建设工程项目的开工建设,对社会经济发展起了重要的推动作用。但随着建筑工程项
在建设社会主义法治国家的今天,新闻自由与司法公正是法治国家弥足珍贵的两大价值。新闻媒体的力量在宪政体制中一直被看作是一种独特而独立的力量而被人们所对待。媒体在法
语文课是一堂引领学生审美的课程,作为语文课堂的第一个环节,语文课堂导入如何唤醒学生的审美愉悦,如何激发孩子们的心理期待,就具有至关重要的作用。因此,本文着重从以下几
第一章绪论针对淹没在强背景噪声中的微弱信号,来分析噪声产生的原因和规律,利用信号与噪声在统计等方面不同的特性,运用现代信号处理手段抑制噪声,进而从噪声中提取微弱信号,是本
本文以制造业为例,对企业财务风险进行分析,旨在解决当前财务危机预警指标以及财务信息失真导致的财务预警失效,在吸收前人成果的基础上,提出了相关的预警指标,进行了实例分
《野草》是鲁迅作品中最被文学研究所关注的作品之一。一方面,使得野草的艺术性、文本主体性研究成果不断,另一方面,也为研究的可创新点带来了困难。本文主要是在前人研究的
视觉是人类获取信息的主要途径,显示则是提供人们视觉素材的主要手段。人类将现代电子学和光学材料的发展成果运用于显示系统,可追溯到1896年阴极射线管CRT的发明,短短110多年,电