论文部分内容阅读
研究目的:视觉假体是一种植入式的医用电子设备。它通过将微摄像头采集的图像像素化处理后转化为电信号刺激视觉神经系统使失明患者重新获得部分视知觉。在视觉假体中,神经电极作用于视网膜,视神经及视皮层上引起相应神经结构兴奋,产生神经脉冲;该脉冲传导至大脑皮层,从而产生视知觉。视觉假体的目的不是再生视觉的所有细节(如:颜色,深度,质地结构),而是仅为患者完成有限的基本生活活动如阅读,行走,运动检测等,提供有用的视知觉信息,但是视觉假体产生的神经活动依赖于刺激微电极与神经单元间点对点的有限数量的刺激。在电刺激神经元的过程中需要提供给电极有限的像素化图像,然而,在日常生活活动中包含的信息量是巨大的,如不经过处理直接用于视觉假体上,盲人会出现不能识别如障碍物等显著性目标。因而需要对摄像头所采集的图像进行显著性处理,得到图像中最显著性的信息。通过分析其中最有效成分,可获得适应于视觉假体的像素化图像,实现视觉假体的最终目的。研究方法:1.Itti模型的研究和分析。RGB图像分解成亮度、颜色和方向图。利用Itti模型对亮度、颜色和方向图三个特征通道进行高斯金字塔分解及多尺度相加运算,得到三个通道的显著图;这三个通道的显著图平均求和得到的综合显著图。2.改进Itti模型。RGB图像分解成H、S和I图取代颜色、亮度和方向图;将RGB图像转换得到HSI图像的H、S、I特征的图像及它们的高斯金字塔分解图像,特征图,显著图以及由显著图加权求和得到的综合显著图。应用显著图精确度和图像处理时间来衡量改进前后两种算法的效果。3.显著图的优化。依据人眼更加关注图像中央区域信息的视觉机制,利用位置显著图对改进的Itti模型进行优化。利用图像的位置显著图对综合显著图进行优化,能够削弱周边区域的显著性。4.改进的显著图算法用于场景中运动的检测。改进的显著图算法处理一段自录的含有运动场景的视频,检测视频中的运动。研究结果:1.一幅RGB图像输入到Itti模型中,首先得出图像的的亮度、颜色和方向的高斯金字塔分解的图像,其次得出这三个通道的特征图和显著图,最后显著图平均求和得出的综合显著图。2.一幅RGB图像输入到改进模型中,首先得出将RGB图像转换得到HSI图像的H、S、I三个特征的图像及它们的高斯金字塔分解的图像,其次得出它们的特征图和显著图以及这三个显著图加权求和得到的综合显著图。3.通过计算显著图的精确度得出利用改进方法提取的显著图比Itti模型提取的显著图精确度提高了约15%-20%。统计改进方法和Itti方法在处理一幅400×300大小图像的运行时间,及他们在处理不一样大小的图像时所消耗的时间,改进算法在检测显著性区域时用的时间少了近50%。4.利用改进的显著图算法用于处理含有运动场景的视频,从仿真结果可看出方法是可以检测到视频中人的运动。研究结论:1.通过对Itti模型和改进方法得到的综合显著图的精确度对比,改进方法提取的显著图比Itti模型提取的显著图精确度得到了提高。改进方法提取的显著性区域要优于Itti模型的结果。2.利用优化的模型检测得出显著图,不管是复杂背景的图像还是人工合成的图像,利用优化的方法都可以得到较好的结果。3.改进方法在运算速度和效率上要优于Itti方法。由于Itti方法除了要提取颜色和亮度特征外,还要提取方向特征,这个过程的运算量比较大。而改进方法精简了不同尺度的3个特征图,且替代了方向特征,运算量要小。4.改进模型用于运动检测算法是可以检测到视频中人的运动,可以用于视觉假体中完成盲人识别场景中运动物体任务的需求。5.改进方法能够有效辨识出图像的显著区域。特别是当视野受到限制时候,有增强低视力的潜力。这方法可以在视觉假体现有的摄像头和可穿戴式的计算平台上实现。可帮助盲人完成基本的生活活动。