论文部分内容阅读
人类视觉具有非凡的环境感知与认知能力,似乎毫不费力就可以对周围环境的典型目标进行识别。随着人类对自身视觉系统的深入了解,借助人类视觉的信息处理机制来增强机器视觉的认知能力已是计算机视觉领域的热点研究内容之一。然而,如何模拟大脑视觉系统的典型功能或信息处理机制,使计算机拥有人类所具备的观察和理解世界能力,却是计算机视觉领域面临的一大挑战。本文主要围绕国家973计划子课题“基于视觉信息的环境感知与目标识别关键技术”(课题编号:2007CB31005)的研究任务,借鉴人类视网膜、视皮层的信息处理机制以及视觉心理认知组织准则,构建具有人类某些视觉功能特性的计算模型或方法,以机器视觉感知的自然环境信息——自然图像①——为处理对象,实现自然图像的显著性处理与自然环境的典型目标识别,为机器人自动导航提供视觉环境感知和信息选择性传输机制的可计算方法。基于视觉认知的自然图像目标识别属于神经生理学、认知心理学、生物物理学、计算机信息学以及自动化等众多学科交叉形成的新兴研究课题。作为交叉领域里的一项基础性研究工作,本文在研究方法与思路上有所突破,研究的内容可概括为以下六个方面:①系统、全面地总结了国内外神经科学家在视觉信息处理上取得的功能性实验成果,分析和讨论了视觉信息处理中层次(初级、中级、高级)功能。在总结国内外相关工作的基础上,重点探讨了基于生物视觉特性的自然图像目标识别所涉及的关键技术与难点。②详细分析了人类视网膜感知外部环境的信息处理机制,提出了一种空间可变分辨率的自然图像处理方法。在人类的视觉感知过程中,视网膜成像的分辨率随着注视点空间位置的变化而不同。依据这一生物事实,本文模拟了人类视觉系统视网膜的感知机制,其研究内容主要包括:(1)通过高斯多分辨率金字塔和视觉对不同分辨率的感知敏感性来模拟视网膜的感知特性,实现了一种新的图像非均匀处理方法。对比传统的均匀图像处理方法,本文的提出的图像处理方法在确保像素分辨率不变的情况下实现频率的选择性传输。(2)通过实验,得到了视网膜中央凹点的位置选择、图像分辨率以及图像压缩率三者之间的初步数据关系,为后续的深入研究或工程应用提供一定的数据参考。本文提出的自然图像显著性处理方法在海量图像数据的远程传输以及基于图像的远程目标识别中具有广泛的应用价值。③受人类视觉初级视皮层(V1)环境感知机制的启发,提出了一种以gabor积分模块为核心的自然图像目标轮廓提取模型与方法。神经科学家研究表明:生物视觉初级视皮层对环境信息具有抑制以及对兴趣目标循环兴奋增强的功能,从而使得视皮层能快速、高效地从复杂环境中提取观察对象的轮廓或边界,为后续的视觉认知提供重要的特征信息。本文在分析生物视觉初级视皮层信息处理机制基础上,构建了自然场景的目标轮廓提取方法。该计算模型在对自然场景中目标轮廓增强的同时对非相关的环境要素进行抑制,从而实现目标轮廓的显著性提取。其研究内容主要有:(1)建立了gabor积分核的统一表达式,并从数学上证明了该表达式具有类似人类认知现象的性质;(2)进一步构建了具有循环反馈、侧抑制、显著增强功能的计算模型与方法,最后以复杂背景的自然图像为处理对象,验证了该方法在提取自然图像显著性轮廓特征的可行性与优越性。④受视觉“what pathway”信息处理机制的启发,提出了一种基于感知不变性特征的自然场景目标识别模型与方法。研究表明:“what pathway”是人类视觉进行物体识别的关键信息通道。在“what通路”中,信息处理开始于V1区,经过V2、V4,最后到达IT区,并最终完成视觉信息的高级加工与识别任务。基于这一生物特性,构建了一种具有“what pathway”功能特性的目标识别分层计算模型与方法,该方法通过有效提取目标的感知不变性特征与可塑性学习实现自然场景的目标识别。实验结果表明,该方法能有效地分类识别出自然场景中建筑物、树、天空、道路、行人、汽车以及自行车等典型目标,并具有较强的鲁棒性和较高的识别率。⑤受认知心理学研究的启发,分析了传统流形认知方法(LLE)在特征学习以及分类识别中的不足,对传统的LLE方法进行了一种有监督的扩展。其改进思路与方法为:(1)将LLE的数据搜索范围限制在类内,这样可以确保在重构权重系数时,仅仅依靠的是类内数据信息,在节省计算资源的同时突现了类别的特征信息。而LLE算法在这一步是对整个样本空间内进行近邻搜索,导致不同类别数据的混合嵌入,弱化了类别信息。(2)流形特征学习完以后,将低维特征进行有监督的fisher子空间二次学习,学习结果使得样本数据的类间离散度最大化和类内离散度最小化,从而提高了分类识别的准确性。在基于自然图像的数字手写体识别实验中,该方法具有较高的正确识别率。⑥针对自然图象数据的非高斯分布特性,对一种自主心智发育认知方法进行了改进,即在传统的发育方法(HDR)上,提出一种基于独立成分特征空间的分级判别回归树(ICS-HDR)。这种新的识别方法首先对测试自然图象样本进行独立成分线性变换,将高维数据转换为互不相关且相互独立的成分,然后依据生物视觉细胞对特征向量维数的反应特性进行样本特征选择,最后进行HDR的分类识别。为了与传统方法进行比较,本文将改进后的方法用于人脸自然图像的身份识别和机器人导航时障碍物方向判断,实验结果表明,本文的方法在识别率和时间消耗上都具有一定的优越性。