论文部分内容阅读
随着AI(Artificialintelligence,AI)全称人机交互的发展,人脸表情识别技术也得到了极大的发展。表情识别技术的发展带动了许多其他行业的发展,例如道路摄像头可以根据对驾驶员表情的识别,发现其有愤怒、急躁等负面情绪时,提醒或者制止其继续驾驶;在线教育课堂的摄像头可以根据听众的面部表情反应,提醒老师哪些地方需要重点解疑,哪些地方可以进行线上互动;再有一些网店店主可以根据对顾客表情的识别记录情况,选择性的促进某些商品的销售。人脸表情和人的肢体动作语言可以反映出人内心的想法或观点,人向外传送信息时,人脸表情占了所有信息的百分七十以上甚至更多,那么对于人脸表情识别的研究就显得非常重要了。
本文的人脸表情识别基础结构模型采用的是传统的卷积神经网络结构,而传统的卷积神经网络结构存在样本图像特征提取不够充分,当网络结构参数过多、样本较少时容易过拟合,无法避免单纯地增加网络的深度去识别准确率反而造成梯度弥散等方面的问题,针对以上出现的问题,本文提出了一种并行卷积神经网络结构,并继续优化为并行多尺度卷积神经网络,以求在网络结构不复杂,结构参数尽可能少的情况下,达到尽量利用表情图像特征信息并适应因特征图像尺寸改变而造成的影响,提高人脸表情识别准确率的目的。并行卷积神经网络能够在提取深层和浅层特征信息的同时,还能实现特征融合;并行多尺度卷积结构能够在避免单纯增加网络层数而造成梯度弥散同时,实现特征信息的多次提取,最终提高了人脸表情识别的识别率。
此外,全连接层引入Dropout防止过拟合作用,改变全连接层激活函数加快训练阶段的收敛速度,扩增训练集表情图像从而避免样本训练量不足而影响识别准确率等技术。
本文主要做了对CNN(ConvolutionalNeuralNetworks,CNN)结构和相关算法的改进,相比之前的研究,识别率有所提升,鲁棒性也得到了加强,对实际应用领域有所帮助。
本文的人脸表情识别基础结构模型采用的是传统的卷积神经网络结构,而传统的卷积神经网络结构存在样本图像特征提取不够充分,当网络结构参数过多、样本较少时容易过拟合,无法避免单纯地增加网络的深度去识别准确率反而造成梯度弥散等方面的问题,针对以上出现的问题,本文提出了一种并行卷积神经网络结构,并继续优化为并行多尺度卷积神经网络,以求在网络结构不复杂,结构参数尽可能少的情况下,达到尽量利用表情图像特征信息并适应因特征图像尺寸改变而造成的影响,提高人脸表情识别准确率的目的。并行卷积神经网络能够在提取深层和浅层特征信息的同时,还能实现特征融合;并行多尺度卷积结构能够在避免单纯增加网络层数而造成梯度弥散同时,实现特征信息的多次提取,最终提高了人脸表情识别的识别率。
此外,全连接层引入Dropout防止过拟合作用,改变全连接层激活函数加快训练阶段的收敛速度,扩增训练集表情图像从而避免样本训练量不足而影响识别准确率等技术。
本文主要做了对CNN(ConvolutionalNeuralNetworks,CNN)结构和相关算法的改进,相比之前的研究,识别率有所提升,鲁棒性也得到了加强,对实际应用领域有所帮助。