轴对称人眼定位特征提取方法在人脸表情识别中的应用研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:liyanxia8521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表情是情绪的外部表现。面部的瞬间表情,显示的是人们内心真实的情感,因此,可以通过面部表情的分析去探究人的情感状态与认知状态方面的内容。美国著名心理学家阿尔培特认为,在人进行感情表达时,往往言词的使用只占7%,而声调占38%,剩下的55%由表情来完成。人脸表情识别的目的是使计算机能够根据人的表情信息,推断人的心理状态,它是一个新兴的热门学科,对人机交互、安全、机器人制造、医疗、通信和汽车领域都起着不可估量的作用。表情识别分为两大类:动态视频的表情识别和静态图像的表情识别。本文针对静态图像的表情识别做了如下工作:1.研究并实现了基于模板匹配的人脸检测方法,包括制作模板、选择匹配算法、进行马赛克检验。自动的表情识别中,成功检测人脸,是表情识别的首要步骤。2.对表情识别预处理方法进行了研究。各种人脸图像形态各异,尺寸不一,背景不尽相同,且存在多种光照条件。本文通过直方图均衡化,图像规格化等一系列预处理步骤,对各种图像进行了预处理,为提高表情识别率奠定良好的基础。3.提出了基于轴对称性的人眼定位方法。表情识别中有个重要步骤是眼睛、嘴巴等特征的定位,本文针对广义中心对称方法的不足,提出了基于轴对称性的人眼定位方法,该方法利用邻域关于过眼球中心的垂直线的轴对称性,以下半圆为邻域,选择轴对称性强的邻域所代表的点作为候选眼睛中心。试验表明该方法的精确度高,速度快,适合于表情丰富的人脸图像。4.将隐马尔可夫应用到表情识别中,分别给每种表情建立了隐马尔可夫模型。表情识别中数据量大,计算相当复杂,本文通过对人脸图像的眼睛和嘴巴区域图像进行K-L变换,提取出主要特征向量,将特征向量输入到隐马尔可夫模型中,通过多次叠代,训练出稳定的模型,识别过程中通过计算给定图像与模型的相似度,认定相似度高的模型所代表的表情即为给定图像的表情。实验证明,隐马尔可夫模型鲁棒性好,将该模型应用到表情识别中比较成功,识别率高。
其他文献
本体映射旨在不同的本体间搭建语义桥梁,以期实现不同本体间的信息交流和知识共享。对于大规模本体,由于其概念数量庞大、相互之间关系复杂,要实现大本体之间的映射变得非常
随着社会信息化进程的不断深入,办公软件已经成为人们日常办公不可缺少的基础软件之一。但自上世纪以来,各个办公软件厂商大多采用封闭专有的文档格式,这些标准不开放,存在安全隐
无线传感器网络是由大量传感器节点组成并以多跳自组织方式构成的无线网络,各传感器节点通过协作方式感知、采集、处理和传输监测区域内被感知对象的信息,并最终把这些信息发
XML已成为Web上数据表示、集成和交换的标准,它格式简单、自描述能力强,越来越多的应用如信息集成、电子商务等使用XML来存储、交换和发布信息。有效地存储和查询XML文档是技术
随着空间数据获取技术的快速发展,空间数据量急剧增加。为了充分地利用空间数据库中的资源,在大量的数据中获取有价值的信息,提出了空间数据挖掘技术。空间数据挖掘技术可以
随着互联网的广泛应用,信息安全问题已成为当今待解决的首要问题之一。密码技术是使信息安全到达最重要的手段。密码体制可分为传统密码体制和公钥密码体制。公钥密码体制可
随着近代计算机技术的飞速发展,孤立词语音识别系统已经取得了较高的识别准确率,非特定人、大词表连续语音识别技术成为当前的研究热点。本论文在国家自然科学基金项目的支持
微博作为一种新型的社交网络平台正受到越来越多人的青睐,使用微博平台分享和获取信息已经成为人们交流的重要方式。由于微博的自发性、低约束等特点,以及缺乏对用户有效的管
目前软件开发的复杂性、多样性和易变性已经成为软件开发者挥之不去的难题。国际对象管理组织OMG针对这些问题提出了模型驱动架构MDA。通过对实际问题进行抽象的建立相应的模
随着Internet的迅速发展,全球对终身教育的需求以及现代远程教育的深入开展,以异步教育方式为主要特征的e-Learning正成为Internet上的一种重要应用,同时为用户提供个性化的服务