论文部分内容阅读
眼动跟踪技术是一种新型的人机交互(Human-Computer Interaction,HCI)技术,而注视点轨迹描述方法是眼动跟踪技术的关键算法,注视点轨迹描述方法的精度直接影响着眼动跟踪的效果。注视点轨迹描述方法通过对采集的眼动视频进行瞳孔定位和注视点标定,来建立瞳孔中心与注视点的映射关系,从而估算人的注视点,得到注视点轨迹和感兴趣区域。注视点轨迹描述技术在医疗领域、心理认知领域、个性化广告推荐领域、安全领域等方面有着广阔的应用前景。因此,加快注视点轨迹描述技术研究步伐,提高注视点轨迹描述技术的核心竞争力,对于有效改善基于眼动信息的人机交互系统性能具有重要的意义。本文给出了一种基于眼动视频的注视点轨迹描述方法,即通过摄像头采集受试者的眼动视频数据,对视频数据帧进行预处理,再进行眨眼检测滤除眨眼帧,并通过瞳孔定位求出瞳孔中心坐标,结合注视点标定建立瞳孔中心与屏幕注视点的映射关系,根据映射关系实时地反算出看屏幕的注视点。本文的主要研究包括以下内容:(1)本文分析了注视点轨迹描述系统的研究现状,针对现有问题提出了基于眼动视频的注视点轨迹描述算法。该方法首先使用红外摄像头采集视频眼动信号,并对其进行滤波去噪等预处理;紧接着,进行眨眼检测和瞳孔定位;并在此基础上,结合所建立的瞳孔-注视点二阶映射关系,进行注视点轨迹的描述。基于该算法对数据的需求,本文设计了实验范式以及三种类型的实验观测图片,实现对视频眼动数据的采集,并初步建立了一个小型眼动视频的数据库。(2)针对瞳孔定位模块,本文给出了一种瞳孔粗定位与瞳孔精定位相结合的瞳孔定位方法。首先,使用红外摄像头采集视频眼动信号,通过自适应二值化阈值等方法对眼动图像进行预处理,提高视频数据精度。其次,进行眨眼检测来滤除眨眼帧,通过行列定位法对瞳孔进行粗定位,并用椭圆拟合瞳孔,求出一个近似圆形瞳孔区域,然后对该区域采用阈值质心法来确定瞳孔中心的精确位置。实验结果表明,该方法在求瞳孔中心点位置时效果显著,可有效提高瞳孔定位的性能。(3)针对注视点标定模块,本文通过非线性二阶多项式函数来求出人眼的瞳孔中心位置和所观看的屏幕注视点坐标之间存在的映射关系。考虑到标定过程的复杂度和所求解映射关系的准确性,本文采用了九点标定方法进行注视点的标定。实验表明,实验室环境下,八位受试者注视点轨迹描述的平均误差为0.414弧度,相比较传统的注视点轨迹描述方法(0.57弧度),其精度提高了0.156弧度。(4)本文在MATLAB平台上设计了一种基于眼动视频的注视点轨迹描述系统。该系统主要由数据采集模块、瞳孔定位模块、注视点标定模块、结果输出模块四个功能模块构成,人们可以通过简单的图形用户界面对系统进行操控。系统能够有效地支持广告类网页布局的优化,从而帮助商家将消费者感兴趣的产品有针对性地进行推广,具有较高的潜在应用价值。