论文部分内容阅读
眼睛是外界信息进入人脑的主要通道,对其活动情况的研究有助于理解人类对信息加工的过程。随着计算机科学与生物医学的飞速发展,在无干扰的环境下,利用计算机对人的视觉过程进行精确追踪的眼动跟踪技术开始成为智能人机交互方式的研究热点之一。本文首先阐述课题研究背景,介绍了国内外视线跟踪技术的现状、发展趋势以及今后应用中视线跟踪系统应满足的要求,并结合视线跟踪技术在多个领域的应用现状,论述了视线跟踪技术所需要解决的问题。接下来从眼球的生理结构入手,介绍了现有视线跟踪注视点估计方法以及基于三维眼球模型的标定和基于二维回归的标定。针对视线跟踪标定函数的建模,对基于瞳孔—角膜矢量的回归方程进行了研究,采用不同方程分别对视线注视点的横坐标与纵坐标进行回归拟合。最后基于标定函数的求解实际上是一个小样本、非线性回归问题的理论基础上,应用了基于瞳孔—角膜矢量的支持向量机回归算法,估计用户的注视方向。基于图像纹理特征的理论,对眼图采用不同的LBP进行直方图统计,仿真结果可以看出LBP统计直方图表示图像局部的纹理信息,可以表征不同注视点眼图的差异,以表达用户注视方向的信息。在此基础上,为了降低纹理特征向量的维数并且能够提取更丰富的纹理特征,将基于多级CS-LBP特征提取得到的直方图特征向量作为支持向量回归机的输入,估计用户的注视方向。最后基于信息融合的理论,提出了基于特征融合的视线跟踪注视点估计的算法。在讨论了眼睛图像模型特征和纹理特征的选取后,将瞳孔—角膜矢量与多级CS-LBP直方图特征向量融合成特征向量,以此作为支持向量回归的输入,进行视线注视点估计。最后,通过实验验证了融合特征用于视线估计的可行性,并且与基于单独特征的SVR视线估计比较,实验的结果表明融合特征的方法在均方误差、平方相关系数以及精度方面,比任何一个单独特征作为支持向量回归输入的方法具有明显优势。