论文部分内容阅读
眼动技术通过从眼动轨迹的记录提取诸如注视时间、注视次数、眼跳距离及虹膜特征等数据,进一步研究个体的内在认知过程。眼动数据分类及虹膜检测技术是眼动关键技术的两个重要分支,眼动数据分类被广泛地应用于市场调查与学习教育等领域,虹膜检测被广泛地应用于生物医学与身份识别等领域。随着大数据的发展及大规模硬件加速设备的出现,本文分别对眼动数据分类和虹膜检测算法进行了研究,并借助深度学习技术,在几个大规模的数据集上均取得了较好的结果。本文的主要研究工作和创新之处可以概括为以下几点:(1)很多现有的眼动数据分类算法首先利用人工设计的阈值分离出眼跳数据,然后利用其他的方法辨别注视与平滑尾随数据。然而针对低采样率、丢帧、性能一般、眼动仪采集到的眼动数据或者不同受试者的眼动数据,利用阈值方法得到的分类结果准确率不高,特别是对平滑尾随数据的辨别效果更差。针对现有眼动数据分类算法的缺陷,本文在对眼动数据分析理论及眼动数据分类算法进行深入研究的基础之上,提出了一种改进的基于自注意力机制(self-attention)的眼动数据分类算法(SATT-BLSTM)。该算法巧妙的将自注意力机制与双向长短期记忆网络(BLSTM)结合起来,BLSTM利用输入的时间窗口数据特征捕获眼睛的较长运动过程,self-attention捕获BLSTM输出数据的内在联系,调整BLSTM输出值的贡献率。此外,利用不同时间尺度的速度与方向作为输入特征,进一步缓解了数据丢帧的情况。在大规模手工标注的数据集上对本文提出的眼动数据分类算法进行了评估。结果表明,改进的基于自注意力机制的眼动数据分类算法优于其他算法,能够获得更好的分类结果。(2)现有的虹膜检测算法大致可分为基于传统的与基于深度学习的检测算法。基于传统的虹膜检测算法的鲁棒性较差,当图片分辩率不高及虹膜受到干扰时,算法的识别与定位准确率较低;基于深度学习的检测模型普遍存在着存储量较大及无法实时检测等缺点。针对现有虹膜检测算法的缺陷,本文在对目标检测模型的基网络结构及轻量级网络模型进行深入研究的基础之上,提出了一种改进的基于端到端的轻量级虹膜检测模型MDLNet,其基网络采用的是多粒度密集连接机制,能够使特征重用并加速网络训练,在参数和计算成本更少的情况下达到了性能更优、模型存储量更小、检测速度更快的目的。在虹膜数据库上对MDLNet进行了评估。结果表明,MDLNet相比于流行的轻量化YOLOV3-tiny网络,检测速度提升了 58%,模型大小减少了 15倍。