论文部分内容阅读
近几年随着人工智能技术的高速发展,人脸表情识别在智能安防、测谎、智慧医疗、互联网教育等领域出现了广泛的应用场景。由于人们通过面部表达情感的方式不同,很难通过人工设计和选择特征的方法高效的获取人脸面部表情的特征分布,因此目前基于深度卷积神经网络自动提取面部表情特征的方法在人脸表情识别中发挥出越来越大的优势。由于缺乏大规模的高质量数据、人脸图像中存在部分遮挡以及表情标签的不确定性,自然场景下的人脸表情识别面临着一些挑战。尽管现有的研究已经提出了许多基于度量学习方法尝试解决这些问题,但它们通常仅仅利用有监督的信息进行学习,由于在自然场景条件下标签存在的不确定性问题,错误的标签可能会导致在指导特征学习时引入错误信息,效果并不好。与以往的工作不同,本文提出了一种新颖的表情特征学习方法,结构相似度对比学习(SSCL)方法,将监督分类损失与无监督结构相似度对比损失相结合。其中,结构相似度对比损失项通过减少同一面部图像转换而来的两个图像特征的结构相似度差异,以自监督的方式提取与表情相关的特征。其中结构相似度差异由特征图的EMD距离作为度量。由于无监督结构损失项不依赖于数据的标签,因此可以减少错误标签的负面影响。此外,本文在结构相似度对比学习方法的基础上引入负样本自适应加权方法,挖掘难负样本,进一步提高了网络模型的性能。实验结果表明,所提出方法在Affect Net、FERPlus和RAF-DB等大规模数据集上优于先前最先进的方法。特别是,特征的鲁棒性也通过遮挡和姿势变量数据集以及交叉数据集的实验得到了验证。