论文部分内容阅读
面部表情是人类传达情感的有效媒介,然而情感的复杂性导致表情识别问题中样例所对应的情感标记不能被确切定义。由于标记分布学习法适用于解决标记语义信息模糊的机器学习问题,并且标记分布学习法在处理表情识别问题时能提供多标记学习法所不能提供的情感分布信息,即各个情感标记对于样例的描述强度。所以,本文利用标记分布学习方法解决表情识别问题。在标记分布学习法的框架下,考虑标记之间的相关性能有效解决类别不平衡的机器学习问题或者提升现有算法的预测效果。其中,高阶相关性通常最适用于模型在现实中所面临的复杂情况。但是,当标记相关性太过复杂时,还会出现模型因自身描述能力不够而无法完全拟合数据集。所以,本文提出的两个表情分布识别算法:基于局部标记相关性的情感分布识别方法(Emotion Distribution Learning based on Local Label Correlation,EDL-LLC)和按层级结构组合局部模型的标记分布学习方法(Label Distribution Learning as Hierarchy Combination of Local Models,LDL-HCLM),通过利用局部数据集中的高阶标记相关性提高LDL算法的表情分布识别能力:(1)EDL-LLC的核心是平衡全局损失函数和局部损失函数的影响,其中,局部损失函数是目标测试样本的预测分布和局部子集中每一个样本的实际分布在标记分布空间中的距离和。实验结果表明EDL-LLC相比于现有标记分布算法、多标记学习算法在多个评判标准下都有明显的提升。(2)LDL-HCLM算法在有效利用局部数据集上的高阶标记相关性的同时弥补了EDL-LLC算法在训练时长、稳定性等方面的不足。LDL-HCLM是一种依赖于局部建模的表情识别算法,它将标记分布中分值最大的标记称为主表情标记,然后依据主表情标记按不同的划分规则将数据集划分为多个子集,训练局部模型。对于每一个局部模型的预测分布输出,该模型对应的上层局部模型将输出其权重,逐层根据权重线性组合各个模型得到整体的LDL-HCLM模型。LDL-HCLM通过增加模型的层数来提高模型的表达能力,从而对于复杂的情感分布数据能拟合地更好。根据实验结果,LDL-HCLM在各个评判标准下相对于其他对比算法的提升效果十分显著,说明它在表情识别过程中确实很好地利用了局部数据集上的高阶标记相关性。此外,以LDL-HCLM模型为核心的“表情识别器(Qt5)”在现实表情视频中也呈现了良好的识别效果。