基于卷积神经网络的人脸表情识别算法研究

来源 :兰州理工大学 | 被引量 : 2次 | 上传用户:zhaoziyuan123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人脸表情识别已经在许多领域有了重要的应用,例如游戏互动、辅助医疗、刑事审讯和智能交通等。但在实际应用中,采集到的人脸表情图像往往具有背景复杂的特点,并且模型训练速度过慢,因而导致表情识别率低且鲁棒性差,难以满足实际需求。K-Means算法作为一种聚类算法,能够训练出符合数据集特性且有良好初值的K均值聚类中心数据集合,将此作为卷积神经网络卷积核的初值来提取特征,可以在一定程度上解决卷积核随机初始化问题。本文在卷积神经网络框架下,结合K-Means聚类思想,提出了一种基于卷积神经网络的人脸表情识别算法。论文的主要研究工作如下:1.在表情识别过程中,如果卷积神经网络(Convolutional Neural Network,CNN)存在层数设置不合理、参数过多等方面的问题时,则会使得CNN的表情识别率低。本文在经典卷积神经网络AlexNet结构的基础上进行了改进。首先,对CNN网络结构主要包括卷积层、下采样层的层数设置以及对网络的激活函数、参数优化方法进行调整,期望提高CNN的非线性表达能力。然后,将卷积神经网络自带的分类器Softmax替换为多分类SVM分类器,期望能够在一定程度上提高模型的分类能力。从模型的性能方面,将新结构算法模型与Alex算法模型进行了仿真实验对比。与此同时,将新结构算法模型和搭载不同分类器的卷积神经网络模型的算法进行了仿真实验对比。仿真实验结果显示,和改进前的AlexNet结构进行对比,改进后的结构能够在一定程度上提高表情识别率。在模型鲁棒性方面,该结构和其它卷积神经网络结构相比也有一定的优势。2.针对卷积神经网络模型训练速度过慢以及在复杂背景下人脸表情识别率不高的问题,引入了K-Means聚类思想,提出了一种基于K-Means聚类思想和CNN相结合的人脸表情识别算法。首先,将本文所提出的新的卷积神经网络结构作为整体框架。其次,通过理论推导和实验分析,设计优化的K-Means模型并应用于卷积神经网络的卷积层中,从而得到具有初值的卷积核以此来提取训练集和测试集中的表情图像特征。仿真实验表明,本文的算法在一定程度上增加了模型的特征提取能力,并且减少了模型的训练时间。
其他文献
清末社会,白话报刊作为新型媒体不断兴起,对下层民众发挥重要的开民智作用。本文从传播学的角度分析了《大公报》刊登白话文的原因,认为白话报刊及《大公报》白话文对五四时
自2005年7月21日起,我国开始实行有管理的浮动汇率制度,这对国内出口导向型行业必定具有多方面的影响。本文以股票收益率作为公司价值的衡量标准,选取沪深两市中制造行业18个
民间法作为与国家法相对应的“非国家法”的范畴,受到法学界的广泛关注,学者们从不同的角度对其进行了研究。自上世纪八、九十年代以来,中国的法治化进程加速,国家法的垄断地
目的综合分析各影响因素,为眼科药物的合理应用提供参考。方法对治疗眼疾药物进行分类研究,探索眼器官各部位对眼药的生物利用度,进而综合评价眼药的合理应用。结果根据眼疾
本文针对压力容器行业需求,以ASME标准为基础,建立了压力容器焊接制造数据库及专家系统。本系统包括压力容器产品焊缝识别卡(JIC)编制管理数据库系统,焊接工艺规程(WPS)编制
2002年9~11月,辽宁省文物考古研究所等对东大杖子墓地进行了发掘,共发掘墓葬13座,其中封土封石墓10座、竖穴土坑墓3座,随葬品共238件(套),主要为铜器,其次为陶器和少量玛瑙、
针对双轴转台标定时安装误差对光学捷联惯导标定的影响,推导了双轴转台安装误差与标定参数的数学关系,分析并量化了转台安装水平误差、方位误差对标定结果的影响。得到以下结
利用植物进行边坡防护与加固,不仅有利于边坡稳定,也利于环境保护,近年来得到越来越广泛的应用,但相关的理论研究并不深入。本文采用有限元数值模拟方法,对植物根系锚固边坡
<正>美国南加利福尼亚大学诺里斯综合癌症中心的学者进行了一项研究,结果显示:喝咖啡可明显降低肝癌发病率以及慢性肝病的死亡率。与不喝咖啡的志愿者相比,每天喝2~3杯咖啡的
田径运动具有发展学生身体素质、磨练意志、陶冶情操、促进身心和谐发展的多元化价值功能,是学校体育的基础。随着全国普通高校体育教学改革的不断深入,田径课程教学面临着巨