论文部分内容阅读
人脸识别是当前图像信息处理、模式识别与机器智能领域的研究热点,在国防军事、公共安全、日常民用与经济建设、以及计算机科学等诸多领域得到广泛的应用。长期以来,主流的人脸图像特征提取方法大多以基于几何距离的可分性判据来作为特征的评价准则,由于人脸表情、姿态的多样性以及受光照、背景等复杂多变因素的影响,往往会造成这些方法所提取的特征,其类内差异大于类间差异,这时利用类间差异来区分不同的个体将变得十分困难。此外,传统的识别方法(如eigenface、fisherface等)均为线性方法,无法提取和利用人脸图像中的非线性结构信息,因此存在着本质上的性能局限。为了有效地提取人脸图像的关键特征进行准确的分类判别,本文对模式识别系统中的模式表征、训练学习和分类识别问题进行了深入的研究;应用自组织与信息理论,结合统计分析及随机逼近方法,建立了一种新的概率型自组织网络(Probabilistic Self-Organizing Network, PSON)模型。PSON具有优异的概率密度估计特性,能准确提取复杂数据的关键特征,可实现对非线性数据的准确的分类。在此基础上,本文设计出了多种基于概率分布可分性判据的高效人脸识别与检测方法。本文的主要研究工作及成果包括以下3个方面:1.对特征选择与主要统计分类方法进行深入研究,将信息论、最大似然估计、随机逼近、自组织神经网络等多种理论方法密切结合,建立了概率型自组织网络模型。PSON可真正应用异质混合来进行概率估计,因而能有效提高估计精度。由于采用随机梯度下降学习方法,PSON能有效克服局部极值点而获得全局最优或接近全局最优的解。此外,PSON是一种非线性特征提取方法,它对输入数据进行聚类而不压缩输入特征的维数,因此在特征提取方面具有明显的优势。本文的研究为PSON建立了明确的目标函数,可为算法的收敛性提供总体性的证明,并从统计学习的角度对自组织映射网络的竞争与协作机制做出全新的解释。同时,通过广泛的实验分析,从概率估计、模式分类、拓扑映射等多方面充分证明了PSON的合理性与有效性。实验还严格证明了PSON在概率估计精度及运算效率上均明显优于期望最大化(Expectation Maximization, EM)算法。对此本文应用随机逼近及神经网络理论进行深入分析,给出了合理的解释。在人工智能与机器学习领域,EM算法是许多聚类算法的基础,但其收敛速度慢、易陷于局部极小点。通过严格的实验分析我们发现,PSON运算效率要比EM算法提高30-80倍,在许多情况下PSON可以完全替代EM算法,因此这一研究具有十分重要的意义。2.应用PSON来快速、准确地建立肤色及非肤色数据分布模型,并与Bayes决策准则相结合提出了一种高效的肤色检测方法。这一检测方法能不断适应待测人群、照明、背景等条件的变化,可大大降低存储空间要求及计算复杂性,从而有效提高检测性能。在涵盖了不同背景、光照及人种的肤色数据集上进行了大量的实验,典型的检测结果为:当正检率(TPR)=80%时,误检率(FPR)=8.2%;当TPR=90%时,FPR=14.2%。实验结果表明该检测方法结果与基于直方图方法大致相当,且略优于基于GMM的方法,而在存储空间要求及计算性能上则具有明显的优势。3.提出了一种新的基于概率分布可分性判据的人脸图像识别方法。该方法应用PSON从人脸图像的有限像素数据中快速、准确地统计出其内在的分布规律;提出了多种快速计算概率函数之间交叠程度的有效算法,成功解决了概率特征的分类判别问题。该方法具有以下一些特点:(1)概率分布反映的是所有模式的内在属性,因此无需进行显式的特征变换,所以不受主观认识的约束与限制。(2)在实际问题中,特征向量的测量与表示总会引入某种误差,体现出一定的随机性,应用概率论的方法来解决分类识别问题,在理论上将更为合理与可靠。(3)可以与识别错误率直接建立联系,依照一定的决策准则,可使分类结果在统计意义上是最优的。(4)使用概率距离来衡量不同类别之间的可分离性,可以有效克服欧氏规范等距离的局限性。(5)其采用的概率密度估计算法在本质上已隐含了非线性变换的性能,可充分利用原始数据的高阶相关性,有效提高数据的可分离度,从而显著提高分类判别的准确性。本文严格依照FERET测试原则,在FR Data人脸库上进行了大量的实验,充分验证了该方法的可行性与有效性。实验结果表明,通常情况下该方法的首次正确识别率可达95%以上,而前5次累积识别率就能达到100%。这一结果大大优于特征脸方法。大量的实验证明,该方法对姿势、表情、部分遮挡及尺度、旋转变化具有很好的鲁棒性,同时在单训练样本条件下也具有非常优异的性能表现。