基于注意力驱动模型的图像检索方法研究

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:naruia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对目前基于内容的图像检索(CBIR)系统在图像内容表示方法方面存在的局限性,探讨了基于内容的图像检索技术中若干个重要问题,提出了一种基于注意力驱动模型的图像检索方法,着重研究了基于内容的图像检索中图像分割以及显著区域的提取问题,构建了一套完整的图像检索方案,并实现了相应的原型系统。实验结果表明,本文提出的方案合理地解决了目前基于内容的图像检索系统中所存在的局限性。在概括地介绍了基于内容的图像检索的研究现状和发展趋势以及关键技术的基础上,本文着重论述了图像中显著区域的提取问题。目前基于内容的图像检索系统大多采用基于全局、半全局特征或基于区域的特征。这样占有图像大部分的背景信息往往决定了检索结果,误导用户对检索结果的理解。本文在研究了基于区域的图像检索技术的基础上,进一步提出了基于注意力驱动模型的显著区域提取方案,该方法首先使用期望最大化算法(EM)对图像进行粗分割,然后使Itti-Koch视觉注意力计算模型提取图像的显著图,最后使用区域增长算法提取出图像的显著区域。本文提出的方法使基于区域的检索在自底向上的视觉注意力模型的驱动下进行,较好地解决了目前图像检索系统检索准确率低的问题。本文的创新点在于摒弃了以往提取图像感兴趣区域的方法,提出了基于注意力驱动模型的显著区域提取方法。注意力驱动方法是模拟人的视觉注意力机制的,从人理解图像内容的特点出发用认识心理学中选取注视焦点的模型来提取图像的显著区域。这样的区域是视觉上的重要区域,优于现在的感兴趣区域提取方法,因此提高了系统的检索性能。
其他文献
互联网的开放性为信息共享和交互提供了极大的便利,但随之而来的网络安全问题也日益明显。防火墙作为一种有效的安全防护措施被广泛应用于各种类型的网络当中。然而,传统的防火
智能规划与规划识别是人工智能(Artificial Intelligent)研究领域的一个重要分支。1995年Blum和Furst提出基于规划图的快速规划方法——图规划(Graphplan),使智能规划领域的
网络地理信息系统(WebGIS)作为网络技术和GIS技术的结合点,随着计算机技术、网络通讯技术、地球空间技术的发展,万维网地理信息系统正成为大众化的信息工具,越来越多的Web站点提
复杂性科学被誉为是"21世纪的科学",主要研究复杂系统与复杂性,涉及领域广泛。其中生物领域的系统最为复杂,与其它领域的系统不同,它们具有一个明显的特点:拥有“活”的元素。这些
随着Internet的飞速发展,网络中的信息急剧增多,网络已成为人们获得信息的必要途径和重要手段。网络中的海量信息既给人们带来方便,也带来了许多问题。面对信息的海洋,如何从中找
目前基于内容的图像检索(CBIR)系统在图像的低层特征与图像的高级语义特征之间还存在着较大的鸿沟,本文针对此问题,提出了一种基于迭代logistic回归和贝叶斯(Iteration Logis
随着芯片技术、通信技术和传感技术的飞速发展,目前传感技术正迈入无线传感器网络新时代。这种网络由大量集成有传感器、数据处理单元和无线通信模块的微小节点组成,通过自组
随着信息技术的飞速发展,计算机网络已经渗透到人们生活和工作的各个方面,移动互联设备也正在逐步成为人们获取信息的主要工具。在此背景下,利用移动设备澡的通信能力进行动
随着高通量生物技术的长足发展,基因芯片和质谱技术逐渐取代传统方法成为对各种疾病和生理特征进行准确比较和量化的重要手段。尽管其前景可观,这类高通量技术给数据分析却带
随着计算机多核、众核平台的发展以及结构化网格的广泛应用,把大量的网格应用遗产代码迁移到多核、众核平台上并高效的利用处理器的性能是一个重要的挑战。  中科院计算所编