论文部分内容阅读
表情是人类内心世界独有的,也是最直接、最全面的表达方式之一。为此,人们一直期望能够通过机器准确地识别人的表情。随着人工智能技术的飞速发展,较为准确地识别人脸表情成为可能,可在人机交互、机器人、公安系统、医疗体系等相关领域得到广泛应用,受到国内外学者密切的关注。然而传统的机器学习在人脸表情识别过程中存在许多问题,例如:在人工进行特征提取时存在表征能力差、特征数据少、信息丢失等不足;在算法上存在对训练数据要求严格、训练模型容易出现过拟合/欠拟合等缺点;在参数优化方面其初始化为零导致模型训练过程出现权重一致而造成陷入局部最优,以至模型难以训练完成,甚至训练失败。为此,针对上述问题,在人脸表情识别系统中的特征提取、参数优化、识别分类三大方面开展研究工作:一、特征提取:选择有意义的特征输入对于深度学习的算法和模型训练十分重要,采用VGGNet网络结构进行特征提取是基于监督学习的卷积神经网络,使用更多的小尺寸的卷积核结构,即使在不同微表情图像下这种网络结构也能对图像进行获取足够多的且具有表征能力强的高级抽象特征。二、参数优化:参数优化不仅决定模型的训练成败,也决定训练模型的识别率,通过对参数采用随机值进行初始化,并且迭代时通过线性组成构建优化学习率函数,提供最优步长,对参数进行了适当的调整,从而有效解决了陷入局部最优值问题。三、分类识别:结合VGGNet网络对特征提取的优势以及卷积神经网络分类识别的特性,从而提出了基于VGGNet深度卷积特征的人脸表情识别改进方法。优化后人脸表情识别系统在曙光服务器上搭建的Tensorflow深度学习框架平台运行,进行模型训练和识别测试。实验结果在FER-2013数据集上,识别准确率达到了85.4%,相比其他方法,识别率得到一定提高,表明VGGNet网络在对图像更高层次的抽象特征提取方面,对于提高识别率以及系统鲁棒性有较好的效果。