论文部分内容阅读
人脸检测问题研究具有很重要的意义,可以应用到人脸识别、新一代的人机界面、安全访问和视觉监控以及基于内容的检索等领域。视频信号是人类接触的最主要媒体,人类接受的外界信息有70%来源于它。因而以数字视频处理为核心的多种应用有着广泛的价值。人脸检测是个复杂且具有挑战性的模式检测问题,在实际应用中,尤其视频检测中,如何面对不同成像条件下对视频信号进行具有健壮性的检测,并且以较高的速度使得其具有实际应用价值,这是我们亟待解决的困难问题。事实上,在模式识别研究领域,这个问题实际为精度和速度之间存在的矛盾引起,有时候需要在速度和精度上博弈平衡才能达到可应用性。就人脸检测研究来说,多数研究者侧重于提高检测精度,但总的趋势是在检测精度提高的同时,速度也越来越受到研究者们的重视。因此,本文的研究目标是构造一个健壮的具有应用意义的视频人脸检测模型,开发实现使之有效工作的一些列算法、技术。本文在已有的方法的基础上,针对视频信号的时序相关性,以及应用环境的随机性和应用实时性的特点,提出了以下改进方法,并且获得了一些有价值的实验结论。本文的研究工作主要包括以下3个方面:(1)利用视频时序相关性选用合适的跟踪算法来提升检测性能。对视频的时序相关性做了研究,将运动信息与目标跟踪算法结合起来,很好的提升了检测性能。利用运动信息来检测目标的运动情况,而后判断帧间变化量,依此作出是否检测的决定,若检测则初步提供运动目标的范围。在运动情况比较稳定或变化小时,利用目标跟踪mean-shift算法来代替每一帧的检测,提升检测性能。(2)利用人脸刻画描述的多样性,增加了特征信息,准确快速的刻画人脸信息。对于人脸的特征描述方法有很多种,有色彩,几何或是灰度特征。不同的描述方法在精度和速度上的表现是不同的,并且要和具体的搜索算法结合在一起。图像空间中,人的眼睛的特征量更为丰富和具有代表性。本文在二值图像中,求出人眼区域的NMI特征,配以跟踪算法来在一定情况下代替每一帧的人脸检测,提高性能。(3)利用视频图像序列提供的多线索,进行合理的决策融合,来增加系统的可靠性。将视频序列的多线索进行融合。本文将Adaboost算法分类器,人脸肤色信息,视频的时序相关性进行了决策融合,克服了单个分类器缺陷并同时发挥几种算法的优势,达到良好的检测跟踪效果。提高了检测性能和鲁棒性。