论文部分内容阅读
斜视是一种常见多发的眼科疾病,约有4%的人群遭受斜视的困扰。斜视不仅会对视力造成严重的后果,而且会对患者的精神心理、社交、工作就业、生活质量等带来严重的影响。为了给予斜视患者合适的治疗,及时有效的诊断尤为重要。但是,临床上的斜视诊断依赖于医师的执行和解释,诊断具有主观性。随着成像技术、计算机技术、图像处理技术等不断发展,尤其是人眼检测技术的广泛应用,基于计算机辅助的智能斜视诊断技术以其自动性、客观性、可重复性的特点日益受到研究者们的关注。目前,国内外研究人员在智能斜视诊断领域的研究尚不成熟,存在的问题主要表现在:(1)采用专门的眼动追踪设备(如眼动仪)或人眼检测专用设备进行眼睛检测和追踪以检查斜视偏斜的方法,设备价格昂贵,一般需要测试前校准过程,对于年幼的儿童和无法进行常规感觉运动检查的患者则不适用;(2)现有的设备或研究对于斜视的诊断主要给出斜视存在与否或方向的结论,而对于斜视程度的量化则研究较少或只是一个粗略的估计;(3)大多数研究关注于智能斜视诊断算法的研究,而斜视专科测试则仍由专业医师执行并利用摄像头等设备手动记录测试的过程,诊断具有半自动性。本论文围绕智能斜视诊断中的人眼检测方法进行了系统介绍和重点问题的研究。论文主要研究工作总结如下:(1)在智能斜视诊断中,为了实现廉价消费者硬件在较少约束环境下获取的低质量眼睛图像上准确鲁棒的瞳孔定位,提出了一种基于级联Haar特征和改进Starburst的瞳孔定位算法。首先通过Haar特征的级联及区域直方图上的Kmeans聚类分割,获取粗略的瞳孔区域;通过边缘检测、边缘滤波以及扇区化操作,得到了不同扇区的瞳孔轮廓点;最后基于扇区化RANSAC策略实现了瞳孔的椭圆拟合。该算法和四种经典的瞳孔定位方法在Pupil-5795、Swirski-600和CASIA-581数据集上做了测试。结果表明该算法在三个数据库上的表现都是最优的,在5个像素误差范围内的瞳孔定位准确率分别达到了92.1%,85.2%,80.2%。(2)针对智能斜视诊断中仅通过瞳孔定位测量眼位偏斜无法排除轻微头部运动的干扰,以及对于单个特征的人眼检测不能综合反映眼睛的整体特性,提出了一种卷积神经网络引导的进化参数眼建模算法。首先眼睛模型由四条参数曲线组成;卷积神经网络模型Dense Net-121被采用作为适应性函数以指导进化;伴随着GA进化搜索,参数眼睛模型向着优化的方向进化以获取最优的模型参数。该算法和五种经典的眼睛建模方法在FAED-50和CASIA-Iris-Distance数据集上做了测试。该算法在FAED-50上表现最优,在眼睛各组分及综合轮廓拟合指标Eiris、Epupil、Esocket及ECTtotal上分别达到了0.62,0.61,0.27和1.50,并且虹膜与瞳孔中心定位在5个像素误差范围内的准确率分别达到了86%和96%;在CASIA-Iris-Distance上,该算法同样达到了可比较或最优的效果。(3)针对目前斜视诊断专科检查依赖于专业医师执行,智能斜视诊断自动化程度不高的问题,搭建了基于遮盖测试的自动遮盖同步追踪的智能斜视诊断硬件平台。操作者通过上位机界面发送指令经USB3.0传输到FPGA,FPGA在接收到指令后控制伺服电机执行相应的动作;近红外相机模组实现在执行自动遮盖测试时同步记录下患者的近红外影像。系统在50s以内完成了斜视专科检查的自动遮盖测试,通过对24个斜视数据的统计分析验证了所提出系统对于实现眼睛斜视诊断的可行性。(4)针对智能斜视诊断对于眼位偏斜测量量化不足的问题,我们收集了24个有效的斜视数据,并提出了一种基于自动遮盖测试的智能视频斜视诊断方法,包括眼睛区域提取、虹膜检测及模板生成、关键帧检测、瞳孔检测、偏移量计算以及斜视诊断等步骤。所提出的智能诊断方法可以实现自动的斜视诊断,尤其是对于斜视偏移量的准确测量上表现出了令人满意的效果,在水平方向8个斜视度误差范围内准确率达到91%以上,在垂直方向4个斜视度误差范围内准确度达到86%以上。另外所提出方法在斜视诊断结果上获得了88.9%的灵敏性,93.3%的特异性,以及91.7%的准确性。