基于统计学习的实时表情识别研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户：sanlyye

【摘要】

：

人脸是人类行为中一种丰富而有力的人际交流信息的来源。人脸表情含有丰富的人体行为信息，对它的研究可以进一步了解人类对应的心理状态。人脸表情也在人际交往和非言语交流中

【作者】

：

周晓旭

【机构】

：

中国科学院自动化研究所

【出处】

：

中国科学院自动化研究所

【发表日期】

：

2005年期

【关键词】

：

表情识别嵌入式区域磁力线马尔可夫模型人脸表情

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人脸是人类行为中一种丰富而有力的人际交流信息的来源。人脸表情含有丰富的人体行为信息，对它的研究可以进一步了解人类对应的心理状态。人脸表情也在人际交往和非言语交流中扮演着非常重要的角色。表情能够填补言语交流的不足，也可以独立传递完整的思想。计算机和机器人如果能够像人类那样具有理解和表达情感的能力，并能够自主适应环境，这将从根本上改变人与计算机之间的关系，使计算机能够更好的为人类服务。这也正是研究人脸表情识别并赋予计算机具有情感理解和情感表达课题的意义。因此，要利用人脸表情所提供的信息，研究出鲁棒、准确、快速且智能的自动化实时的人脸表情识别方法是非常重要的。本文研究基于统计学习的实时表情识别，在理论研究和实际应用方面都取得了很好的成果。主要贡献包括：第一，在表情识别的预处理阶段，本文创造了一种全新的特征空间：区域磁力线(AML，AreaMagneticLine)特征空间，并将其用于人脸检测方面。我们将AML与当前最流行的Haar特征空间做了对比实验。AML不但可以描述Haar特征所能描述的情况，并且更优于Haar特征的描述能力。利用AML，我们不单单只是去描述相邻区域的相互关系，还可以描述不相邻区域的相互关系，这是Haar特征无法做到的。通过实验可以看出，使用AML特征空间提升了人脸检测的性能。第二，在人脸定位部分，我们对局部搜索策略进行了改进，提出了新颖的发散ASM方法。此方法解决了传统的ASM方法中很容易将搜索点定位到局部极小值的情况。当输入图像的质量较差而难以对齐的时候，我们将可能趋于局部极小值的点发散到该组观察点最外侧的点的位置上，然后通过判断最终得到的模型挑选出对齐正确的图像。通过发散ASM，我们可以对人脸定位的结果进行评估，进而提高整个表情识别系统的性能。第三，提出了一种新型的基于嵌入式隐马尔可夫模型(EHMM，EmbeddedHMM)的实时表情识别系统，首次将嵌入式隐马尔可夫模型应用到表情识别中，并且取得了不错的效果。我们的算法使用观察序列窗口的二维离散余弦变换(2D-DCT)系数作为观察序列，从而减少了观察向量的个数，大大降低了训练和识别系统的复杂程度。从试验结果可以看出，该方法对于实时的面部表情识别是一种有效的方法。此外，我们还将我们的实时表情识别系统与实时的人机交互网络游戏相结合，通过摄像头采集玩家的脸部视频流，并将截获到的各帧图像送到表情识别系统中进行表情识别。游戏角色表情判别模块通过表情识别的结果更改游戏窗口中虚拟角色的表情，并保持与现实中玩家的表情同步变化，从而大大提高了用户与计算机之间的互动，增加了在网络游戏环境下人与人之间的交互性。第四，在第三章工作的基础上，将具有自学习能力的统计学习方法Boosting引入到基于EHMM的实时表情识别系统中，并创造了全新的自适应嵌入式隐马尔可夫分类器：AdaEHMM分类器。利用AdaEHMM，我们使嵌入式隐马尔可夫模型的参数训练和结构选取具备了自学习的能力。通过调整样本的权重，将分类错误的样本权重提高，并将分类正确的样本权重降低，从而加强分类器的分类能力，最终得到具有强分类能力的AdaEHMM分类器组合，不仅可以根据样本的训练得到优化的EHMM结构和参数，还提高了系统的灵活性和表情识别的识别率。

其他文献

粗糙集理论及数字化工厂技术在企业生产DSS中的应用研究

数字化工厂方面,详细论述了数字化工厂的概念和特点.研究了数字化工厂与虚拟制造的关系,明确了两者之间的区别、联系和研究方向.对数字化工厂系统总体功能和模块功能进行分析

学位

决策支持系统粗糙集计算机辅助生产工程数字化工厂虚拟制造动作时间测量故障诊断流程企业数据挖掘

开关磁阻电动机新型控制策略研究

开关磁阻电动机(Switched Reluctance Motor,简称SRM)具有结构简单坚固、体积小、重量轻、工作可靠、制造成本低廉等诸多优良特性。由其组成的调速系统(Switched Reluctance Motor Drive,简称SRD),是继异步电动机变频调速系统和直流电动机调速系统之后,又一极具发展潜力的新型调速系统。它集开关磁阻电动机、电力电子技术和控制技术为一体,不仅保持了交流异

学位

开关磁阻电动机微步控制直接转矩控制无位置传感器仿真DSP

CT—MR医学图像融合效果评价的研究

本文针对医学CT和MR融合图像，采用统计特性、信噪比、梯度值、模糊积分等数学工具进行了客观的评价。特别是利用模糊数学中的择近原则衡量了源图像在融合图像中所占有用信息的

学位

医学图像图像融合模糊积分融合算法

基于FPGA的运动目标检测算法研究与系统实现

近年来，计算机视觉这一新型交叉学科领域逐步得到了众多专家学者的关注，它在家居安防、工厂监控、智能交通等方面都有着及其广泛的应用。计算机视觉衍生出了很多的分支课题。其

学位

运动目标检测算法理论系统设计现场可编程门阵列

提高移动机器人远程通信质量的研究

对于移动机器人而言,远程通信是一项基本能力。这就要求移动机器人与监控中心之间能高效、稳定地进行各种数据的实时通信。然而,通信数据量大与目前网络性能不高之间的矛盾,

学位

远程通信RTP拥塞控制BP神经网络带宽利用率

基于嵌入式PLC的拉力试验机控制器设计与实现

拉力试验机是通过对材料进行拉伸，压缩，弯曲，剪切等力学测试，获得材料力学特性的工具。拉力试验机控制器作为整个系统中的核心部件，用于系统驱动和控制功能的实现。随着对材料力学

学位

拉力试验机嵌入式可编程控制器系统设计性能指标

工业控制信息安全数据采集系统的设计与实现

随着信息技术、网络技术和自动控制技术的不断进步，工业控制信息安全问题越来越受到国家、企业和民众的关注，对工业控制信息安全进行研究，需要数据采集系统提供实时、可靠、丰富

学位

数据采集系统结构设计工业控制信息安全管理

可视电话—H.323通讯协议栈软件设计与实现研究

中国通信网宽带化和IP 化的趋势,推动了多媒体通信业务的不断膨胀。目前,国际上网络会议软件和网络电话软件采用如下有两个标准:ITU-T 制定的H.323 协议族和IETF 制定的SIP。

学位

H.323H.245可视电话通讯协议栈实现

室内移动机器人双目视觉SLAM方法

随着人口老龄化不断提高，家庭服务机器人越来越受到社会的关注。移动机器人同时定位与地图创建(Simultaneous Localization and Mapping,SLAM)技术是实现整个移动机器人自主导

学位

移动机器人双目视觉SLAM方法立体匹配特征提取

城市交通地图道路网络识别与提取

　　本文综合运用图像处理、模式识别的理论对彩色城市交通地图道路网络识别与提取过程进行研究。在地图规范化处理的基础上，通过对地图中各类噪声的分析建立基于梯度算子

学位

栅格地图矢量地图图像处理模式识别噪声特征

基于统计学习的实时表情识别研究

其他学术论文