基于深度学习的图像检索方法的研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:heying423
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的图像检索方法在计算机视觉领域备受研究者的关注。首先提取图像的整体语义特征,然后在数据库中查找与之语义相似的图像。检索任务中最重要的环节是图像的特征提取,但是基于手动的特征描述算子只能提取图像的局部纹理、颜色等信息,无法提取出图像所表达的整体语义特征。近几年,基于深度学习的卷积神经网络在计算机视觉领域取得了突破性的研究和进展。卷积层和全连接层均可以作为图像的特征进行检索任务:基于卷积网络的图像检索方法,本文的主要工作如下:(1)针对卷积层的特征向量无法进行相似性检索的问题,本文提出了基于卷积特征融合的图像检索方法(Spatial Weighted Feature,SWF),将三维特征图的每个像素赋予对应的权重,编码为一维的向量进行检索任务。通过可视化的方法,展示了本文提出的特征聚合方法和传统的线性累加聚合之间的区别。实验表明,本文提出的特征聚合方法,能够更加突出感兴趣区域的轮廓,提升了检索性能。(2)针对全连接层的图像特征维度过高的问题,本文提出使用深度哈希编码将高维的向量映射为低维的二值向量。但是哈希编码需要使用Sigmoid非线性映射将神经元映射到0和1之间,考虑到使用Sigmoid会产生梯度消失和爆炸的风险,本文提出基于约束编码的图像检索方法(Deep Constraint Binary Code,DCBC),并且深入分析了编码层特征在不同的约束条件下的激活直方图。实验分析表明,基于约束编码的特征提取方法,能够增强编码特征的区分度,提高检索性能。(3)针对在复杂场景下图像检索需要对场景中的物体进行筛选的问题,本文提出使用注意力机制的图像特征提取方法。提取图像中最为重要区域的特征,并非将全局的语义信息都用来图像检索。实验分析表明,注意力机制的图像检索方法能够较好的克服干扰像素对检索任务的影响,提高检索性能。
其他文献
当今社会,随着经济的高速发展,城市化进程不断推进,城市人口数量也急剧增加,尤其是像中国这样的人口大国,许多一线二线城市,一系列高密度人口问题愈发突出。大型商场、露天广
商业银行如同生产企业一样,需要通过渠道向消费者提供产品和服务,从而实现其盈利的目标。因其经营领域的特殊性,商业银行主要依靠自身的营业网点和虚拟渠道进行销售活动。从
科学民主的政府决策是社会主义民主政治建设的重要任务,也是实现政府管理现代化以及加强政府自身建设的客观要求,而科学民主的决策离不开专业的决策咨询机构和社会公众的参与
近年微流道器件在生物芯片、微机电系统、光学应用等方面都展现出强大的市场潜能。传统的微流道器件主要通过光刻和3D打印等方法制备,存在耗时、成本高或分辨率低的问题,而高精度微流道器件的制造又存在工艺复杂、成本与实验环境要求高等难题,限制了该器件在产业及科研领域的深入推广。所以本论文提出了一种简单且经济的微流道器件制备方法,主要通过静电纺丝近场直写纤维主模制备PDMS微流道器件。围绕熔融近场直写取向纤维
可再生能源发电单元输出功率具有强不确定性且难于预测,高比例可再生能源接入互联电力系统必然对系统的稳定运行和电能质量造成不利影响。本文主要针对高比例可再生能源系统的负荷频率控制(LFC)开展研究。利用不确定性人工智能-云模型理论,旨在解决实际电力系统运行中不确定性引起的LFC控制器质量下降问题,以满足日益扩大的可再生能源接入规模,提高可再生能源的渗透率。本文首先介绍了云模型理论及其应用,并将云模型算
当前,我国正处于社会转型、经济转轨、观念转变的历史阶段,国内银行所面临的外部环境、约束条件和客户需求发生了前所未有的新变化,经营管理遇到了严峻挑战。这些变化和挑战
目的:本研究观察乌药水提液对IBS-D模型大鼠胃肠功能及血清脑肠肽Ghrelin、MTL、SP、Sec水平的影响,探讨乌药治疗功能性胃肠疾病的可能疗效机制。方法:将60只大鼠随机分成6组
阅读理解任务是给定一篇文本,要求机器根据文本的内容回答相应的问题,该任务现在已经成为自然语言处理领域的研究热点。本文以北京语文高考文学类阅读理解解答任务为背景,对
随着公共租赁住房进入后期管理阶段,其再分配问题引起了各界关注。再分配中的调整问题是一种更为复杂的分配问题,其关键点在于对调整市场中新租户和旧租户效率和公平的权衡。
随着现代科学技术的快速发展,人们对移动通信的要求越来越高,通信系统不仅需要解决传输视频、图片、数据等大容量的信息,而且还要保证传输的高速率和高品质,天线作为一种能量