基于视觉认知的自然图像目标识别研究

被引量 : 0次 | 上传用户:cao678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类视觉具有非凡的环境感知与认知能力,似乎毫不费力就可以对周围环境的典型目标进行识别。随着人类对自身视觉系统的深入了解,借助人类视觉的信息处理机制来增强机器视觉的认知能力已是计算机视觉领域的热点研究内容之一。然而,如何模拟大脑视觉系统的典型功能或信息处理机制,使计算机拥有人类所具备的观察和理解世界能力,却是计算机视觉领域面临的一大挑战。本文主要围绕国家973计划子课题“基于视觉信息的环境感知与目标识别关键技术”(课题编号:2007CB31005)的研究任务,借鉴人类视网膜、视皮层的信息处理机制以及视觉心理认知组织准则,构建具有人类某些视觉功能特性的计算模型或方法,以机器视觉感知的自然环境信息——自然图像①——为处理对象,实现自然图像的显著性处理与自然环境的典型目标识别,为机器人自动导航提供视觉环境感知和信息选择性传输机制的可计算方法。基于视觉认知的自然图像目标识别属于神经生理学、认知心理学、生物物理学、计算机信息学以及自动化等众多学科交叉形成的新兴研究课题。作为交叉领域里的一项基础性研究工作,本文在研究方法与思路上有所突破,研究的内容可概括为以下六个方面:①系统、全面地总结了国内外神经科学家在视觉信息处理上取得的功能性实验成果,分析和讨论了视觉信息处理中层次(初级、中级、高级)功能。在总结国内外相关工作的基础上,重点探讨了基于生物视觉特性的自然图像目标识别所涉及的关键技术与难点。②详细分析了人类视网膜感知外部环境的信息处理机制,提出了一种空间可变分辨率的自然图像处理方法。在人类的视觉感知过程中,视网膜成像的分辨率随着注视点空间位置的变化而不同。依据这一生物事实,本文模拟了人类视觉系统视网膜的感知机制,其研究内容主要包括:(1)通过高斯多分辨率金字塔和视觉对不同分辨率的感知敏感性来模拟视网膜的感知特性,实现了一种新的图像非均匀处理方法。对比传统的均匀图像处理方法,本文的提出的图像处理方法在确保像素分辨率不变的情况下实现频率的选择性传输。(2)通过实验,得到了视网膜中央凹点的位置选择、图像分辨率以及图像压缩率三者之间的初步数据关系,为后续的深入研究或工程应用提供一定的数据参考。本文提出的自然图像显著性处理方法在海量图像数据的远程传输以及基于图像的远程目标识别中具有广泛的应用价值。③受人类视觉初级视皮层(V1)环境感知机制的启发,提出了一种以gabor积分模块为核心的自然图像目标轮廓提取模型与方法。神经科学家研究表明:生物视觉初级视皮层对环境信息具有抑制以及对兴趣目标循环兴奋增强的功能,从而使得视皮层能快速、高效地从复杂环境中提取观察对象的轮廓或边界,为后续的视觉认知提供重要的特征信息。本文在分析生物视觉初级视皮层信息处理机制基础上,构建了自然场景的目标轮廓提取方法。该计算模型在对自然场景中目标轮廓增强的同时对非相关的环境要素进行抑制,从而实现目标轮廓的显著性提取。其研究内容主要有:(1)建立了gabor积分核的统一表达式,并从数学上证明了该表达式具有类似人类认知现象的性质;(2)进一步构建了具有循环反馈、侧抑制、显著增强功能的计算模型与方法,最后以复杂背景的自然图像为处理对象,验证了该方法在提取自然图像显著性轮廓特征的可行性与优越性。④受视觉“what pathway”信息处理机制的启发,提出了一种基于感知不变性特征的自然场景目标识别模型与方法。研究表明:“what pathway”是人类视觉进行物体识别的关键信息通道。在“what通路”中,信息处理开始于V1区,经过V2、V4,最后到达IT区,并最终完成视觉信息的高级加工与识别任务。基于这一生物特性,构建了一种具有“what pathway”功能特性的目标识别分层计算模型与方法,该方法通过有效提取目标的感知不变性特征与可塑性学习实现自然场景的目标识别。实验结果表明,该方法能有效地分类识别出自然场景中建筑物、树、天空、道路、行人、汽车以及自行车等典型目标,并具有较强的鲁棒性和较高的识别率。⑤受认知心理学研究的启发,分析了传统流形认知方法(LLE)在特征学习以及分类识别中的不足,对传统的LLE方法进行了一种有监督的扩展。其改进思路与方法为:(1)将LLE的数据搜索范围限制在类内,这样可以确保在重构权重系数时,仅仅依靠的是类内数据信息,在节省计算资源的同时突现了类别的特征信息。而LLE算法在这一步是对整个样本空间内进行近邻搜索,导致不同类别数据的混合嵌入,弱化了类别信息。(2)流形特征学习完以后,将低维特征进行有监督的fisher子空间二次学习,学习结果使得样本数据的类间离散度最大化和类内离散度最小化,从而提高了分类识别的准确性。在基于自然图像的数字手写体识别实验中,该方法具有较高的正确识别率。⑥针对自然图象数据的非高斯分布特性,对一种自主心智发育认知方法进行了改进,即在传统的发育方法(HDR)上,提出一种基于独立成分特征空间的分级判别回归树(ICS-HDR)。这种新的识别方法首先对测试自然图象样本进行独立成分线性变换,将高维数据转换为互不相关且相互独立的成分,然后依据生物视觉细胞对特征向量维数的反应特性进行样本特征选择,最后进行HDR的分类识别。为了与传统方法进行比较,本文将改进后的方法用于人脸自然图像的身份识别和机器人导航时障碍物方向判断,实验结果表明,本文的方法在识别率和时间消耗上都具有一定的优越性。
其他文献
全球化时代,社会文化渗透于生活的各个领域,人们的文化需求和精神追求将会越来越强烈,文化事业和文化产业的发展程度成为制约国家综合发展水平的重要因素。人才作为推动文化
我国行政事业单位会计集中核算是源于政府会计人员管理的会计委派制,是在不改变单位资金支配权、资金收付渠道和会计责任的前提下,进行会计核算、资金管理、财政监督和会计信
<正>"内容为王"的时代,品牌与用户深刻融入时代演进,走过产品经济时代、服务经济时代,如今我们来到了体验经济时代。经济活动更强调互动性和参与性,追求更高层次的商品服务和
随着我国经济实力的不断发展壮大,我国的城市化率不断上升。城市的快速成长扩大以及城市发展过程中对于资源的需求不断加大,导致了城市与城市之间的竞争关系愈演愈烈。但是在
溶液调湿空调系统由于具有高效率,能够实现湿度的精确调节、废热的利用并且能提高室内舒适度等优点被越来越广泛地利用。在溶液调湿空调系统中,溶液除湿剂直接与空气接触,实
油田开发动态预测是认识油田开发现状的重要手段,准确有效的油田开发动态预测有利于决策者制定科学合理的开发方案,从而指导油田开发工作。近年来国内外许多水驱油田开始进入
目的探讨剖宫产产妇产褥感染危险因素及护理对策。方法选取2015年1月~2017年12月我院收治的剖宫产产妇99例,通过回顾性分析收集产妇临床资料,统计产褥感染产妇例数,经单因素
以拐枣和冬枣为试材,研究拐枣果汁冬枣果粒悬浮饮料的制备。在拐枣果汁含量为25%的基础上,探讨冬枣果粒含量和蔗糖、柠檬酸、琼脂的用量对悬浮饮料品质的影响。实验结果表明,以0.3
计量是会计系统的核心职能。公允价值计量作为一种能代表未来、面向21世纪的会计计量模式(黄世忠,2001),是一个非常有意义、值得研究的选题。在2007年由美国次级贷款风波所引
伴随国内报业纵深发展以及我国加入WTO后,传统报业面临国内外的竞争愈加激烈,其生存和发展很大程度上取决于人才。基于此,越来越多的报业管理者认识到以报业采编人员为主体的