论文部分内容阅读
人脸是人类在日常交流中用于传达身份和表达情感最关键的生物特征。随着计算机技术的迅猛发展,人脸识别技术凭借其非接触性、非侵入性和高准确性等优势,逐步成为计算机视觉以及生物识别领域最重要的研究方向,在安防、监控、娱乐等诸多领域具备广泛的应用前景。稀疏表示和字典学习理论自2009年以来得到了迅猛发展,并依靠其良好的泛化能力和对遮挡等因素的鲁棒性逐渐成为研究的热点,在图像分类、图像去噪、生物识别等领域有广泛应用。因此,深入研究基于字典学习的人脸识别算法,提高其判别能力和泛化能力,获得更好的分类效果,不仅具备极高的科研意义,还具备了非常重要的现实意义。本文基于现有的用于分类的字典学习算法,提出了两种新颖的判别字典学习算法,并将其应用于人脸识别中。将提出的字典学习算法在多种真实的数据集上进行验证,实验结果表明本文提出的算法具备很好的鲁棒性和分类性能,并且优于许多现有的人脸识别算法。本文的具体工作说明如下:首先我们提出了一种应用于人脸识别的判别字典学习算法,结合训练样本的标签信息学习一个过完备字典,它由所有类别都会使用的共享原子和部分类别使用的特定原子组成。为了提高字典的判别能力和分类的准确性,我们提出在损失函数中添加额外的标签约束项来限制非紧密相关的特定原子大系数的出现,从而扩大不同类别之间的差异。此外,受拉普拉斯特征映射原理的启发,提出拉普拉斯组正则化,以提高相同类别的表示系数的相似性以及标签的一致性。编码正则化过程中采用?2范数代替常用的?0范数或者?1范数进行,加速学习过程和分类速度,从而获得解析解。随后,还提出了全局编码分类器和局部编码分类器来评估模型。人脸识别结果证明,本文提出的算法获得了很高的分类准确性,并优于许多已有的人脸识别算法。我们还提出了一种改进的判别字典学习算法,在上述算法的基础上,平衡了人脸识别问题的时间成本和信号重建残差的权重,采用cubic拟合模型计算此类算法在生成字典时的时间成本,采用基于SVD的方法估计信号重构中的残差,为原始信号自适应选择一个最优的稀疏编码维度,以较小的准确率为代价来尽可能降低计算冗余度。人脸识别的实验证明,本文提出的算法能够实现期望的分类结果,并获得相当快的字典学习过程,具有很好的鲁棒性。