论文部分内容阅读
图像是人们获取外界信息的重要来源,也是进行信息交流的重要媒介。如何得到一种高效实用的图像表征方法,对于深入理解图像处理和图像理解,并为图像后续加工提供强有力的支持具有重要的意义。这种高效的图像表征模型对于进一步如何获得更高效的图像编码方式、计算机视觉处理机制等都具有重要的促进作用。目前流行的图像处理方式都是以基于像素为单位进行的,这种纯粹从工程角度出发提出的各种理论和方法,一般都面临着图像信息数据量大、处理效率低下、硬件要求高、无法解决复杂场景的认知等问题。相比之下,在生物视觉系统中,却能够很容易的从复杂背景中辨认出各种尺度、各种特性的物体。因此,借助于生物视觉系统的神经机制和认知心理理论,完全有可能找到一些新的突破点,以解决目前制约计算机视觉中图像认知的一个瓶颈问题。本论文的研究依托于2010年国家973重大基础研究计划“数字媒体理解的理论与方法研究”(Project No.2010CB327900),主要完成了以下研究工作。首先利用视网膜神经节细胞非经典感受野的生理机制建立了多层次、有反馈机制的神经计算模型,利用神经节细胞感受野根据图像刺激性质能够动态调节的特点建立表征单元,从而实现对图像纹理块的自动分析与提取。所设计的神经回路模型具有白顶向下的主动调控功能,能够参考图像刺激的属性,实现神经元的整合和主动选择功能。其次,根据图像的颜色和纹理变化利用感受野进行整合后的输出阵列来实现图像的通用表征。相似的地方用一个大尺寸的感受野来进行表征,颜色变化剧烈的地方用若干个小的感受野来进行表征。为了验证最后的神经节细胞输出阵列是否忠实的能够表示原图像,我们用实验验证了图像本身具有的统计特性与表征所需的感受野个数之间的关系,结果表明,经过重新表征后的图像能够忠实的表现原有图像的性质。建立表征的目的是为了提高后续更高级别的图像处理的效率,我们在表征的基础上进行了特征匹配、图像分割等具体应用的实验,从实验效果上可以得出算法性能有了较大的提升。此外,为了更好的证明非经典感受野对图像处理的促进作用,在神经节细胞感受野表征输出的基础上设计了一个具体的轮廓检测模型,该模型很好的利用了非经典感受野的抑制和去抑制特性,结合图像的多尺度信息,较好的解决了轮廓检测中的“弱轮廓”和噪音偏大等问题,并用定量分析的方法证明了将非经典感受野机制应用于轮廓检测中具有较好的性能。