论文部分内容阅读
机器视觉是人工智能科学的一个重要内容,人脸分析是机器视觉的难点技术,它包括人脸检测和人脸识别两部分。其中人脸检测是实现智能化识别的关键环节,具有重要的研究价值。根据历史发展过程来看,人脸检测从初期的重点提高系统精度,到现在的保证精度的前提下提高系统速度并达到实时的时期,过程中有大量高效的检测算法被提出和发展,其中最有代表性的是基于AdaBoost的人脸检测算法。这种人脸检测技术通过积分图和分类器级联等方法能够有效地降低系统检测检测时间,提高系统效率,并保证了较高水平的精度,真正达到了实时系统的标准。这样的方法后来被许多学者进行研究改进,目前在检测的综合性能上总体表现十分优良。不过对于该基于样本学习和特征检测的方法,训练速度的考虑相对较少。由于现代数据库的容量大和更新快等特点,训练效率的重要性不断提高。本论文将提升训练效率作为突破口进行重点研究。首先通过对AdaBoost算法中的PAC学习模型、Haar-like特征、积分图、分类器训练及检测器级联五个关键技术进行分析,通过概念阐述和理论推导详细讨论了各阶段算法的性质,作为后面讨论的理论基础。然后通过训练成本分析实验阐明了特征筛选的必要性;通过特征值分析实验阐明了特征筛选的有效性和可行性,探讨了特征优劣的衡量指标。结合实验分析结果,接下来对本文提出的特征筛选方法开始详细介绍。首先介绍了一种预处理特征筛选方法。该方法基于综合评价理论,结合实验分析得到的评价指标,能够对特征按比例进行筛选。这样的筛选过程能够保证所有淘汰的特征对于异类样本检测的差异性低于所有保留的特征。接下来介绍了一种与级联同步的筛选方法。该方法利用级联结构由简到繁的特性,依靠特征的相对贡献度进行特征筛选。在样本库更新过程中,该方法具有良好的适应性。文中提出的两种方法可以根据实际综合使用。最后通过特征筛选实验,分析验证了关于特征的相关参数属性,说明了论文中特征筛选方法的理论和实际意义,并展望了未来的研究方向。