论文部分内容阅读
视频中的人脸识别拥有十分广阔的应用前景。本文围绕如何完成视频信息初期的筛查,如何得到更好的人脸表示,如何得到更好的识别算法这三个问题进行研究:为了完成视频信息初期的筛查,去掉冗余重复的信息。本文研究了视频分段的方法,主要包括基于像素点的方法和基于颜色直方图的方法。通过大量实验确定分割阈值,对比测试两种方法的正确率和查全率,最后研究了采样间隔对于视频分段效果的影响。为了得到更好的人脸表示,本文首先研究了人眼定位,采用了一种PCA结合SVM精确人眼定位方法,并提出一种单层离散映射神经网络模型求解凸二次优化问题(即求解SVM分类问题),对模型能够得到最优解和在权值随机初始化条件下模型收敛这两个问题进行了理论证明。其次,在提取人脸Gabor特征后,采用PCA结合LDA的特征选择模型,探究了如何选择降维后特征维度问题。为了得到更好的人脸识别算法,本文研究了多种人脸识别模型,包括SRC, LASRC等稀疏表示模型和CRC-RLS等协同表示模型,提出了基于协同表示思想的识别模型SCRC。然后研究了联合贝叶斯模型并且针对训练样本不均衡的情况提出了一种改进联合贝叶斯模型。探究了算法识别正确率和总体入库人数的关系,算法识别正确率和检索库每个人样本数量的关系,给大规模人脸检索系统的搭建提供数据指导。最后研究了多对多人脸比对模型,研究了多种比对方式及该模型的稳定性,实验结果表明该模型能够使得识别率获得较大程度的提升。本文的实验主要基于两个人脸库。一个是本文收集创建的互联网人脸库,该人脸库规模庞大,人脸状况复杂,更加贴近真实视频场景。另一个是PIE库,PIE库是人脸识别领域得到广泛认可的人脸库。本文主要研究1:N模式,因此除了首位识别率这一指标外,还采用了Rank 1~Rank10这一指标,探究了1:1模式下各算法性能,最后展示了视频中人脸序列在多对多模型下识别效果。