论文部分内容阅读
眼睛是一种重要的生物信息,包含了表情、身份、性别的多种信息,在模式识别,疲劳驾驶检测和人机交互等多方面有重要的作用,本文主要研究的是眼睛检测与视线跟踪算法。首先,在Paul Viola矩形特征人脸检测思想的基础上,又设计了一些适合于眼睛的矩形特征,利用这些矩形特征训练了Adaboost层叠分类器,用于眼睛检测,并根据眼睛对称性的特点,应用了一些几何特征对层叠分类器的检测结果进行校正。几何特征的加入使得小样本训练的粗分类器的应用成为现实,提高了眼睛检测的精度。眼睛的位置确定后可以在此基础上进行眨眼判断、视线跟踪等的研究,本文对眨眼问题做了简单的讨论,重点研究的问题是视线跟踪。本文的视线跟踪算法是将眼睛的空间坐标与红外眼睛图像的LBP特征相结合作为视线判别的特征,通过支持向量回归的算法预测视线方向与屏幕坐标的映射关系,实现了人在与计算机进行交互过程中头部自然运动情况下的视线跟踪。在计算眼睛的空间坐标时,文中采用了一种新的双目视觉的算法,这种算法简单,计算量小,比较准确,能够满足本文视线跟踪中眼睛空间坐标计算的需要。利用红外眼睛图像LBP特征来表示眼睛视线的信息,是对经典的基于红外线眼睛图像的瞳孔中心反射点向量方法的一种改进。传统的瞳孔中心反射点向量的算法,在计算瞳孔中心时通常需要边缘形状检测,然后确定中心位置,由于瞳孔的形状随着眼睛运动会产生变化,而且瞳孔的边缘经常会出现模糊现象影响瞳孔中心的检测结果,同时反射点过大也会使检测的反射点位置发生偏移,所以在计算瞳孔中心反射点向量时经常会出现误差,影响实验效果。利用LBP特征不仅能够表现瞳孔中心反射点向量的信息,而且还能体现视线方向变化时眼睛的纹理变化。经过大量的实验表明,本文使用的跟踪方法比经典的跟踪算法的效果有明显的改善,视线跟踪达到了很好的效果。