基于生物视觉机制的场景识别关键技术研究

来源 :东北大学 | 被引量 : 1次 | 上传用户：ahjon

【摘要】

：

基于生物视觉机制的场景识别是通过模拟人类的感知能力来挖掘图像中的场景特征,进而推断出图像间的类别关系,从而自动地识别出图像所隶属的场景。由于场景识别技术可以有助于

【作者】

：

陈硕

【出处】

：

东北大学

【发表日期】

：

2011年01期

【关键词】

：

场景识别视觉显著性检测鲁棒各向异性扩散区域分割局部不变特征

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

基于生物视觉机制的场景识别是通过模拟人类的感知能力来挖掘图像中的场景特征,进而推断出图像间的类别关系,从而自动地识别出图像所隶属的场景。由于场景识别技术可以有助于解决目标跟踪与定位、视频内容分析、图像智能检索和视觉机器人导航等一系列具有代表性的计算机视觉及模式识别领域的应用问题,所以场景识别成为该领域中非常活跃和富有挑战性的研究课题之一,受到了国内外研究者的广泛关注。本文针对基于生物视觉机制的场景识别的关键问题展开研究,主要研究内容及成果主要体现在以下几个方面：研究人类视觉系统的注意力选择机制及显著性检测模型的原理,分析并对比空域检测模型和频域检测模型的内在机理与性能。提出了一个将SR、PFT及PQFT为代表的频谱检测模型囊括其中的统一的基于幅度谱调制的视觉显著性检测算法框架。在此基础上,提出了基于幅度谱均衡调制的ASBM模型,在一定程度上解决传统算法在特定条件下的检测不准确问题。仿真实验证明,本文提出的ASBM模型在检测的准确性,鲁棒性以及抗噪能力方面均优于该领域中性能较好的PQFT模型,因此使视觉显著性检测算法得到进一步优化。针对光照变化给视觉显著性检测及场景识别带来的问题,研究基于颜色恒常性理论的图像增强算法,重点分析了经典的多尺度Retinex算法的原理,并指出其采用的高斯滤波所存在的不足,提出了基于鲁棒各向异性扩散的改进多尺度Retinex算法,从而在一定程度上解决了传统方法存在的边缘伪增强问题,能够进一步保护具有场景分析价值的边缘信息,并将改进的算法应用于颜色恢复。对比实验证实,该算法在得到较好的颜色恢复效果同时,还能获取更清晰的边缘信息,为具有场景代表性的区域分割以及局部稳定特征提取工作提供必要的保障。研究了基于图像内容表征的场景识别方法,提出了快速的基于视觉显著性的场景代表性区域分割框架,在一定程度上解决传统的面向场景识别的图像处理方法需要遍历整幅图像所带来的计算低效率问题。其中,基于熵优先策略的区域提取算法通过计算显著点的邻域信息熵来确定场景代表性区域中心,实验证明该算法具有较好的鲁棒性和抗噪性,并且提取到的区域与局部不变兴趣点之间存在较好的场景一致性。而基于先验知识的显著建筑物分割算法可以实现建筑物区域信息在图像像素级上的精确检测,并将其应用于室外场景数据集。与其他方法相比,该分割算法不仅能够检测到图像中建筑物的存在,还可以提取其细致的区域信息,并在去除非遮挡干扰目标的同时还能去除遮挡建筑物的干扰目标。研究局部不变特征描述子的特点及构造过程,并通过对比分析选择了性能较好的SURF算法作为重点研究及使用目标,提出了基于多方向融合的主方向定位算法,能够获得比SURF算法更好的主方向定位结果。提出了基于兴趣点强度、对比度及微小尺度子空间的兴趣点密度的相似兴趣点竞争策略,进一步去除了兴趣点中的噪声点,从而提高了局部特征的匹配准确率及目标的识别效率。研究现有场景识别方法的特点及流程,结合本论文课题研究的划分粒度较小的固定场景识别问题,选择了本论文提出的具有较好性能的ISURF特征,并利用前面得到的场景代表性区域的分割结果来有效地缩减ISURF特征的待搜索空间,降低了算法的计算复杂度与计算时间。针对图像局部特征所带来的三层类别归属关系,设计了基于场景分析机制和竞争机制的IHDR树状分类器,并提出了基于ISURF特征与IHDR树的场景识别方法。实验结果表明,该方法在分类与识别结果和平均计算时间上均取得了较好的效果。

其他文献

SH公司销售业务内部控制案例研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

学位

销售业务内部控制理论信用管理理论

脉冲发放皮层模型图像融合技术研究

脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)是第三代人工神经网络的典型代表。PCNN演化自哺乳动物视觉皮层神经元同步振荡现象。PCNN数学模型参数多且计算复杂度

学位

脉冲耦合神经网络PCNN脉冲发放皮层模型图像融合多尺度分解

掌握现代营销礼仪提高营销综合素质

本文从掌握现代营销礼仪的意义及原则、营销人员应掌握的现代营销礼仪等三个方面加以阐述,以便提高营销人员的营销综合素质。

期刊

营销人员礼节仪表礼俗营销礼仪

基于应用型旅游人才培养的专业课程创新探索--以《旅游策划》课程为例

《旅游策划》是旅游管理专业的重要课程,也是一门实用性较强的课程。课程肩负培养旅游策划类应用型专业人才的重任。依据应用型旅游专业人才定位和培养要求,文章对课程的教学

期刊

应用型旅游策划课程教学application orientedtourism planningcurriculum teaching

浅谈儿童舞蹈表演与创编

舞蹈直观形象、生动活波,深受儿童欢迎,儿童舞蹈教育也是音乐教育的重要部分。好的舞蹈创编能够使儿童感受美以及培养他们的表现美的能力,同时也能够使儿童在美的环境下获得

期刊

儿童舞蹈表演创编

丁苯酞联合阿托伐他汀对急性脑梗死患者血流动力学及血清SOD、GSH-Px、NO水平的影响

目的:观察丁苯酞联合阿托伐他汀治疗急性脑梗死患者的疗效及对患者血流动力学及血清超氧化物岐化酶(SOD)、谷胱甘肽过氧化物酶(GSH-Px)、一氧化氮(NO)水平的影响。方法:选取2

期刊

急性脑梗死丁苯酞阿托伐他汀血流动力学超氧化物岐化酶谷胱甘肽过氧化物酶一氧化氮

限制性液体复苏对创伤致脓毒性休克患者血流动力学及心肌损伤的影响

目的：评价限制性液体复苏对创伤所致脓毒性休克的治疗效果。方法选择该院救治的创伤所致脓毒性休克的患者60例分为研究组和对照组，各30例，对照组给予积极液体复苏，即早期给予快速

期刊

限制性液体复苏心肌损伤脓毒症预后imited fluid resuscitation myocardial injury sepsis progn

多元绑定技术在局域网中的应用

文章提出了多元绑定接入技术的应用解决方案，通过对用户身份灵活的多元绑定，实现局域网络的统一、精确的用户管理，消除局域网络管理的漏洞。

期刊

局域网多元绑定MAC地址IP地址Local Area Network Pluralistic tied MAC addrsee IP addres

增强现实和图像风格化中的图像结构分析算法研究

近年来,随着图像采集设备的普及和基于图像的计算机图形学应用的发展,诸如梯度场、线条等图像结构信息的提取与运用已成为图像处理的主流方向之一。分析图像结构的长远目标在

学位

图像结构增强现实图像和视频风格化梯度场线条提取

公路路基加宽施工技术研究

期刊

公路建设路基施工加宽操作具体应用

基于生物视觉机制的场景识别关键技术研究

与本文相关的学术论文