正面人脸判别方法的研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:catbull
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文研究正面人脸图像的判别方法,原因有两个: (1)目前,许多实用和稳定的人脸识别算法都是基于正面人脸图像或近似正面的人脸图像。例如,联想公司新近推出的基于人脸识别的电脑登陆系统在使用时就不断提示用户正面面对摄像头。 (2)目前,许多基于人脸识别的门禁或登录系统,人脸图像从摄像头采集的视频序列中提取。同一个人往往可以提取多帧人脸图像。正面人脸图像判别方法可以从中筛选正面人脸图像或近似正面的人脸图像进行识别,提高系统的识别率。 本论文集成了自己提出的和其他一些文献提出的正面人脸图像判别方法,构建了一个完整的和实用的正面人脸图像判别系统。这个系统可以全方位判别人脸图像的变化,进而从中筛选正面人脸图像或近似正面的人脸图像。正面判别算法主要包括以下三个部分: (1)绕Y轴旋转(即面对摄像头左右旋转)的人脸图像的判别方法。面对摄像头左右旋转的人脸图像是摄像头采集的最为常见和大量的非正面人脸图像。本论文根据输入图像的格式不同而使用两种不同的判别方法: a)基于人脸图像两侧边缘肤色点数目比例的判别方法。该方法适用于彩色图像。随着人脸的左右旋转,人脸图像两侧边缘肤色点的数目将会发生显著的变化。本论文利用这一特征进行正面人脸判别。这个方法是本论文原创的方法,已经申请了发明专利(申请受理号:200810218424.X,公开号:CN101383001A)。 b)基于傅里叶变换对称性的判别方法。该方法适用于灰度或红外图像。正面人脸图像左右两边大致对称,进行傅里叶变换后,其实部要远远大于其虚部。本论文利用这一性质进行正面人脸图像的判别。这个方法源于文献[37]的启发。 (2)绕Z轴旋转(即面对摄像头倾侧)的人脸图像的判别和校正方法。本论文首先利用Adaboost眼睛分类器和其他一些图像处理的方法确定人脸眼睛的坐标,然后根据垂直方向的坐标判别是否存在人脸倾斜并校正倾斜的人脸。 (3)绕X轴旋转(即面对摄像头伏仰)的人脸图像的判别方法。人脸面对摄像头伏仰会造成鼻尖到眼睛与鼻尖到嘴巴中心的距离的比值异常。本论文根据这一特征判别人脸面对摄像头的伏仰。这个方法基于文献[39]的统计数据。
其他文献
随着计算机技术的发展,可视化技术有了很大发展,在工程和计算各个领域都有了广泛的应用。特别是在仿真领域,可视化技术的引入成了一个热门研究方向,并得到大力发展。在雷达仿
LDPC码是线性分组码的一种,它的校验矩阵有一个明显的优点,那就是其有较好的稀疏性,性能可以接近香农限,最初是在1960s年代由Gallager在他的博士论文中提出,由于当时计算能力
空间谱(DOA)估计是阵列信号处理中的一个重要的研究方向,在雷达、通信、声纳等众多领域有极为广阔的应用前景。空间谱估计侧重于研究空间多传感器阵列所构成的处理系统对感兴
伴随着无线通信技术的快速发展和广泛应用,频谱资源的短缺问题也日益严重。认知无线电技术能够感知“频谱空洞”,并通过机会式的频谱接入和切换实现对频谱空洞的利用,同时不
视频作为多媒体的一个方面已经得到了越来越广泛的应用,并成为了人们生活中必不可少的一部分。视频的信息量大,占用的带宽也就更高,因此要求视频压缩编码标准在保证视频解码
无线通信系统中的MIMO技术已日渐成熟,且已成为LTE/LTE-Advanced中的关键技术。目前LTE标准所支持的最大天线数目为8,其实际的频谱效率仅为5 bps/Hz。Massive MIMO作为MIMO技
人工神经网络(Artificial Neural Network,ANN,简称神经网络)是由大量神经元相互连接而构成的系统,以其并行处理、分布式存储、自适应自组织自学习和高度容错能力等特性,在诸多学科
随着信息技术和Internet技术的发展以及市场竞争的加剧,我国各型企业纷纷建立起自己的管理信息系统,基于B/S结构的Web应用程序开发技术成为企业构建管理信息系统的一个研究热点
伴随着通信技术的不断迅猛发展,人们对通信质量的要求不断提高。纠错编码是提高信息传输可靠性和有效性的一种重要手段,它已经经历了几十年的历史,在此期间有了很大的进展。
近年来,随着无线技术和Internet的不断发展,人们对可携带、可移动的计算机或工作站的需求也不断增长,无线局域网(WLAN)以其高灵活性、安装便捷、易于扩展和支持可移动计算等