基于CNN-RNN网络的图像高层次语义检索

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zhlinen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息的数据量呈指数级增加,大规模图像数据的快速检索越来越成为人们关注的领域。数据库往往存储了千万量级的图片,人们在日常处理中越来越需要从巨量的信息中快速的找到自己所需要的的内容,所以图像检索越来越重要,其应用范围越来越广泛,应用价值也越来越大,但是图像检索领域一直面临着检索速度、语义检索、存储代价等多方面的挑战。从基于文本的检索到基于内容的检索,检索系统的速度与精度一直在提升,存储代价也得到了很好的解决,但是基于语义的检索一直是困扰现在检索系统的一个重要因素,“语义鸿沟”一直是一个难以跨越的问题,即难以从图片数据上提取出包含丰富语义信息的特征,而特征的提取和表示一直是图像识别和检索领域的一个关键环节,优秀的特征提取和表示算法,不仅能为后续识别和分类算法带来方便,更能提升整个视觉系统的性能。
  传统的算法精度低,速度慢,所以,以深度学习为技术的基于内容的图像检索是当今最终要的研究方向,即基于颜色、纹理、空间形状等的图像检索,近几年兴起的哈希编码也有效地解决了很多问题,极大的提升了检索系统的性能,但是没能完全解决提取图像语义表示的问题,但是仍不能有效提取图像的高级语义特征。因此,在当今图像信息量日益增长的形势下,高效地进行图像语义方面的检索成为我们追求的目标。本文针对图像提取的特征表示语义能力的不足及图像特征数据的高维度的问题和基于文本的检索的优点,提出基于CNN-RNN(convolutional neural network –recurrent neural network)网络的图像高层次语义检索的方法,可以在一定程度上改善“语义鸿沟”问题对系统的影响。本文主要的研究内容和工作包括以下三个方面:1)提出基于CNN-RNN编解码网络提取图片特征并结合词向量的算法。把深度学习在CV(computer vision)、NLP(nautral language process)方面近几年的进展结合,使用CNN-RNN编解码网络结构来提取图像的自然语言描述。首先,使用在coco数据集上预先训练好CNN-RNN网络,CNN网络部分提取图像的特征向量,接着用RNN在束搜索(beam search)的指导下搜索出可能性最大的自然语言描述,然后使用word2vec模型在语义向量空间中进行文本相似度的计算与排序,最后输出与查询图像相似的图像数据库中的图像。最终实验部分证明了本算法在保留图片语义信息的同时能有较高的检索精度。
  2)提出编解码网络和注意力机制的图片检索算法。首先,在CNN-RNN编解码网络的基础上把提取图像自然语言描述的网络结构改进为一种效果更好的含有注意力机制的结构,在输出自然语句的每一个时间步时,网络能利用注意力机制选择更加关注图片的哪个区域,从而更有针对性的输出相关的单词。在提取语句特征向量的时候把仅使用词向量的方法改为使用doc2vec,这样模型能关注语句的词的顺序,提取出能更好的表示语义的固定长度的语义向量进行计算。在向量空间中计算查询图像的特征和图像特征数据库中特征的相似度并排序输出,算法在解码器部分加入了注意力机制,增强了模型的效果,得到了更高的检索精度。
  3)提出基于改进的注意力机制特征提取与文本向量的算法。首先分析注意力机制的缺点,然后在自注意力机制结构上加以改进,增加了另一层注意力机制(通过点积),两层注意力机制的结构使得模型在每一时间步加权得到的向量包含更多对应输出的单词信息,其次,在网络的CNN编码部分和RNN解码部分都加入了改进后的注意力模块,最后也同样在两个数据集上验证了本算法的有效性。
其他文献
目的肿瘤的发生是因为细胞在化学、物理等致癌因素作用下,某些抑癌基因发生改变,失去对其生长的正常调控,最后导致异常增生。细胞凋亡是细胞的程序性死亡,是细胞生物体维持机体平衡的关键,在机体正常发育、自稳态的维持、免疫耐受的形成、肿瘤监控等过程中均发挥重要作用。因此,诱导癌细胞凋亡和抑制增殖,以此清除体内多余、受损或危险的细胞而不对周围的细胞或组织产生损害,是癌症治疗的重要研究方向。佛手中含有多糖类、黄
学位
食用菌栽培基质是以麦秆、麸皮、木材等原生生物质为主料,食用菌在生长过程中通过分解培养基中木质纤维素汲取自身生长所需营养物质,待其成熟并采摘后剩下的固体副产物即为食用菌菌渣。生物质主要由纤维素、半纤维素和木质素组成,三者通过氢键和化学键紧密连接,类似粘合剂的木质素形成保护壳层将纤维素包裹其中形成结构较复杂的化合物,经降解后发酵可获得生物乙醇。木质素是阻碍酸、纤维素酶降解纤维素的最大屏障。通过预处理可
学位
学位
植物内生菌与宿主长期共生,能够增强植物抵抗生物和非生物胁迫的能力。锰是植物生长发育所需的重要微量元素,但高浓度的锰会对植物产生严重毒害,筛选耐锰内生菌并接种于植物中,是提高植物耐锰的有效手段。本文从龙葵等植物中分离、鉴定出具有耐锰性的内生菌,并基于环介导等温扩增(LAMP)技术开发了快速鉴定的分子标记,随后对其最高耐受浓度、锰离子去除率等生物学特性进行研究,最后探究耐锰内生菌对小麦锰胁迫的响应。主
学位
学位
用平板培养测定法从188株根际微生物中筛选出20株对辣椒疫霉菌有拮抗作用的细菌,其中7株表现出对棉花枯萎病具有不同程度的拮抗性.该文从这20株拮抗菌中选出具有较强拮抗作用,能够分泌大量抗菌蛋白的两个菌株AI-01、FR-03.分别研究了pH值、发酵时间、通气量及不同培养基种类对二菌株产生拮抗物质的影响.测定了AI-01、FR-03对辣椒疫霉菌具有抗菌活性的最低有效含菌浓度及最低有效无菌滤液滤度.并
学位
该文综合了二阶矩和PDF(概率密度函数)概念的优点,提出了湍流燃烧的二阶矩-PDF(SOM-PDF)模型.该文对甲烷-空气旋流湍流燃烧和NO生成进行了实验研究.为了考察旋流数对燃料NO生成的影响,在燃料中加入少量的氨(NH)来模拟燃料氮.进一步,该文应用Reynolds应力方程模型和SOM-PDF湍流燃烧模型对轴对称旋流燃烧室中不同旋流数下的湍流流动、甲烷-倾家荡产气旋流湍流燃烧以及NO生成进行了
该文分析了配电系统可靠性研究的现状.基于电力市场条件下可靠性反映电价的特点,阐述了加强配电系统实时可靠性研究的必要性,并基于此,对配电系统实时可靠性的基本理论作了分析.该文建立了一套配电系统实时可靠性评估的故障遍历算法,其中包括基于信息熵理论的电力系统短期负荷预测的神经网络算法、基于功率前推回代法的配电网潮流算法和基于树的广义标准存储结构的故障遍历算法.该算法能有效考虑系统的负荷特征、系统的容量约
学位
为了提高横向功率器件的击穿性能以满足日益增长的设计需求,人们针对横向功率器件的漂移区进行了诸多优化。在这些技术中,漂移区横向变掺杂技术(Variation of Lateral Doping, VLD)是能够获得完全均匀表面电场的技术之一,且被认为是最成熟的技术。然而在实际制造过程中,横向变掺杂器件往往会面临一些实际问题。例如,由退火导致的漂移区纵向掺杂不均匀的影响以及由器件版图所带来的三维曲率效
在众多毫米波器件中,InP/InGaAsHBT器件凭借其优异的材料性能及卓越的高频特性广泛应用于航天系统,军事通讯,卫星等系统中,展现出了很大优势。然而在复杂的空间辐照环境中,InPHBT器件及电路的应用面临巨大的挑战。空间中的高能重离子、质子等对工作在其中的InPHBT器件及电路产生各种辐照损伤效应,例如,单粒子效应、位移效应等,这些辐照效应使得InPHBT器件或电路性能发生瞬时或永久的改变,进