论文部分内容阅读
人脸姿态估计在人脸识别系统和人机接口等领域一直是重点研究内容,具有广泛的应用价值。在人脸识别系统,人机交互系统,门禁系统及其它应用场景中,人脸姿态估计是非常关键的一步,良好的人脸姿态估计将有助于提高系统的性能。目前国内外对于人脸姿态估计问题的研究方法众多,比如基于几何方法,基于人脸外观的方法以及非线性回归的方法,基于非线性流形方法等,其中基于几何和人脸外观方法在人姿态估计问题上得到了广泛的应用。然而,上述方法在人脸姿态估计的实际应用上具有很大的局限性。
本文在比较了各种解决人脸姿态估计问题的方法后,提出一种新的人脸姿态估计方法——基于局部线性嵌入(Local Linear Embedding,LLE)算法和BP(Back-Propagation)神经网络的人脸姿态估计方法,并用它进行大范围内的人脸姿态估计。LLE算法属于流形学习算法的一种,基本思想是将全局的非线性转化为局部线性,而互相重叠的局部邻域能够提供全局结构的信息,这样对每个局部进行线性降维后,再按照一定的规则将结果组合在一起,就能够得到低维的全局坐标表示,在本文提出的人脸姿态识别方法中,首先通过它得到训练样本在低维嵌入空间上的流形表示,随后将降维后的训练样本数据及其对应的姿态角信息分别作为输入向量和目标向量训练BP神经网络。针对测试样本,不再是传统上同训练样本一起降维,而是采用了局部线性映射的方法得到其在低维流形上的表示,最后将此表示送到训练好的BP神经网络中得到姿态估计结果。本文提出的方法可以认为是一种流形嵌入方法,也可认为是一种非线性回归方法。本文方法源于文献[1][2][3]的启发。
在实验中,本文将LLE算法和PCA线性子空间算法分别结合BP神经网络、线性判别函数F组成五种不同的人脸姿态估计方法,并分别对人脸在Yaw方向上的转动进行姿态估计,结果表明,本文提出的LLE+BP方法取得了稳定且有效地估计结果。