论文部分内容阅读
大脑中约有80%到90%的知识和记忆都是通过眼睛获取的,对眼睛运动进行测量和跟踪一直是研究者关注的热点。随着视线跟踪技术的发展,视线跟踪的应用从传统的心理学、行为学分析等推广到商业、军事、娱乐、日常生活、人机交互等各个领域,应用前景十分广阔。基于此背景,本文将针对头戴式视线跟踪系统做深入研究。论文首先论述了视线跟踪技术的发展状况和前景,讨论和比较了目前已有的各种视线跟踪技术,在此基础上提出了一种新型头戴式视线跟踪系统的构架方案,即基于视频图像的视线跟踪方法。本文创新性地采用两幅图像中瞳孔中心位置的偏移来判断视线方向,然后根据头部位置对注视点坐标进行修正。该方法可提高头部转动情况下视线方向检测的准确性。在此基础上,为了在满足实时性要求的同时更精确地提取瞳孔中心点坐标,本文提出了一种改进的瞳孔提取算法。该算法主要分为三步:特征点检测、杂点消除、椭圆拟合。与Starburst算法相比,该算法不采用任何迭代方法,并且不需要提前移除角膜反射亮斑,在拍摄图像清晰度不高时仍有较好的瞳孔提取效果。采用以上系统构架和算法,在仿真实验环境下,本文提出的视线跟踪方法具有良好的跟踪效果,准确性较高。 在视频图像分析领域,视线跟踪技术可实时跟踪并获取人眼注视点。人眼注视点也可不采用任何设备而是通过图像分析方法直接提取,即通过对视觉注意机制建模估算人眼在观看图像或视频时的注视点或注视区域。视线跟踪技术对人眼视觉注意机制建模具有重要的指导意义,可用来检验视觉注意模型提取的注视点或注视区域的准确性。本文在研究视线跟踪技术的基础上,同时开展了对视觉注意机制及其模型的研究。 视觉注意机制建模在视频图像处理、压缩编码、质量评估、目标跟踪、机器视觉等研究领域具有重要意义。视觉注意机制可分为两类:数据驱动的视觉注意及任务驱动的视觉注意。本文首先在数据驱动及任务驱动的实验中采用视线跟踪系统记录实验对象的眼睛注视点,并提出一种三维数据相关性度量方法,分析了两种视觉注意机制之间的差异。结果显示任务和视频内容会显著影响人眼注视点的选择。基于以上成果,本文对Itti的模型进行了改进使之适用于视频图像。比较结果显示,改进模型提取的人眼注视区域与视线跟踪实验获取的注视区域基本吻合,而Itti的模型由于缺乏运动特征,与实际注视区域差异较大。这说明改进Itti模型后视频图像人眼注视区域的估算准确度较高。