论文部分内容阅读
计算机视觉和模式识别是当今科研领域中前沿的课题,其中包含的一个重要内容就是图象理解。图象理解的含义是指,不仅仅是能让机器智能地恢复出图象的结构,而且能够让机器知道这幅图象的意义,或者说这幅图象究竟代表了什么。根据图象理解的内涵,首先应该构造一个合理的模型来表征图象中所包含物体的结构,然后让计算机(机器)通过学习来智能地识别这种结构。在当前科研的背景下,我们意识到完成这项任务是非常艰巨和困难的。在过去的十几年中,人们已经利用统计建模的思想对世界中的物体结构如何描述进行了一定的研究,但远远还没有形成一套成熟、系统和广泛应用的理论模式;尤其是对于具有复杂结构和易变形状的物体,比如,人脸或人体的某些器官(如心室)等,构造一个合理、泛化性能良好的模型来描述图象中包含的物体结构更加困难。
本文以人脸为研究对象,针对当前主流的两种统计建模方法,主动形状建模(ASM)和主动面部建模(AAM)方法,对其中的若干关键问题进行了深入地研究,并将研究成果应用于面部表情识别系统,开拓了面部表情识别算法的新思路,增强了系统的鲁棒性,具体的研究内容着重体现在以下几点:
1.系统综述了面部统计建模方法的历史与现状对国内外该领域的研究动态进行了详细地综述,并对面部统计建模中的重点、难点以及应用前景进行了阐述。
2.对传统的主动形状模型进行了详细地讨论传统主动形状模型包括两个子模型,全局形状模型和局部纹理模型,它们分别是由对应于训练集中的关键特征点进行主分量分析获得。全局形状模型是对所搜索图象中的物体的整体形状进行约束,使之产生的形状与训练集合中的形状类似;而局部纹理模型则对如何进行图象的搜索指明了方向,为搜索能够朝着最优的方向提供了理论依据。
3.对传统的主动面部模型进行了深入地研究相对于主动形状模型而言,传统主动面部模型则包含了更加丰富的面部纹理信息,主要体现在模型的构建过程中使用了全局的面部纹理信息,而不象主动形状模型那样,仅仅使用面部关键点附近(法线方向)的信息。因此,从某种意义上说,主动面部模型是主动形状模型的推广,它的性能要优于主动形状模型;然而,由于使用了全部的面部纹理信息,同时带来了计算量的增加。
4.对主动形状模型进行了推广,提出了加权主动形状模型针对主动形状模型构建中的几个问题进行了深入研究,体现在以下几点:
·对主动形状建模初期的预处理算法进行了研究,将一般的广义对齐算法进行了核化,使其推广到非线性的情况,增强了预处理的性能。
·对较少标定点条件下的主动形状模型进行了研究,根据人脸轮廓在整个面部信息中所占比重较大这一先验知识,通过改变面部质心的方式来进一步提升搜索的速度,加快了ASM方法搜索的性能。
对传统主动形状模型中的局部纹理子模型进行了研究,通过深入挖掘局部纹理的信息,将局部纹理模型进行了推广,由三个子模型来代替,分别从形状的内部、形状本身及其外部三个方向来对其进行约束,不仅提高了搜索的速度,同时也改善了搜索的精度。
5.局部信息缺损条件下的主动面部建模方法的研究在许多情况下,由于获得的人脸面部图象往往是有遮挡的或信息缺损的。针对这种现象的经常性,对局部信息缺损下的主动面部模型构建进行了深入的研究。借助于缺损信息条件下的主分量分析这一有利的工具,将传统的主动面部建模方法推广为局部信息缺损条件下的主动面部建模。实验证明,我们提供的方法在一定程度上可以将有遮挡的图象恢复(重建)出来,而且在某种精度下可以取得令人满意的效果。
6.将主动形状模型运用于面部表情识别将主动形状模型、Gabor变换以及弹性图匹配结合起来,应用于面部表情识别,开拓了面部表情识别的新思路,改进了提取特征参数的精度,从而也提高了识别的性能。