论文部分内容阅读
随着人脸检测技术的发展,各种人机交互系统在日常生活之中得到了广泛的应用,并且人们也对于人机交互技术提出了更高的要求,即在人脸位置检测的基础上进一步实现面部特征定位。人脸位置检测作为机器视觉中的重要课题,涉及到了诸如数字图像处理、机器学习和模式识别等数个领域的知识。在人机交互技术中,人脸位置检测是整个系统中的关键部分,需要人脸位置检测具有实时性、高精度等。对于目前的人机交互系统,根据是否与观测者产生接触,可以分为接触式人机交互系统和非接触式人机交互系统。由于非接触式人机交互系统并不与观测者产生接触,所以观测者的体验更为舒适和自然,因此也更具有良好的应用前景。作为非接触式人机交互系统中的一种,无辅助立体显示系统中采用了内置的摄像装置,视频中面部特征所包含的像素有限的。为了实现实时、准确并且稳定地定位观看者的面部特征坐标,结合目前人脸检测、面部特征定位和目标跟踪技术,本文中提出了一个用于人脸位置检测并进行面部特征定位的系统,采用肤色检测-人脸检测-面部特征定位的顺序,将多种算法进行级联完成系统。对与整个无辅助立体显示系统,为了提高系统的可拓展性,降低后期的维护成本,设计了一套分为三层的系统架构:硬件层、中间层和界面层。通过将不同的模块进行隔离,实现了模块之间的去耦合,确保了系统后期易于维护。为了在确保人脸位置检测和面部特征定位的精度的同时,提高整个系统的运行速度。算法中第一级进行肤色检测,采用椭圆模型实现关于肤色的像素的聚类,将候选区域从背景中分离出来,减少检测窗口的数量。并通过对不同的光照强度进行参数调整,提高了算法的鲁棒性和分类的效率。在面部特征定位中,采用ASM(主动形状模型)算法。使用68个特征点的模型,建立人脸全局形状模型和特征点局部纹理特征,描述出了特征点的分布和特征点周围的纹理信息。在确定特征点的位置时,选用马氏距离计算目标之间的距离,突出了方差较小的维度的重要性。在多轮迭代之后,确定特征点的最佳坐标,实现面部特征的精确定位。在目标跟踪中,采用TLD (Tracking-Learning-Detection)算法。相比于传统的跟踪算法,在检测模块和跟踪模块的基础上添加了学习模块。检测模块将方差分类器、集合分类器和最近邻分类器进行级联,实现目标的检测。跟踪模块采用了Lucas-Kanade光流算法对目标进行跟踪。在检测目标和跟踪目标成功时,获得目标的正负样本。学习模块采用半监督学习学习正负样本,并调整检测模块和跟踪模块的参数,实现长时间的目标跟踪。本文中提出的算法实现了无辅助立体显示系统中需要的实时性和高精度的要求,并且对于观测者出现的面部旋转、面部遮挡以及外界光照条件变化等不同的复杂环境具有较高的鲁棒性。