基于稀疏编码的图像检索技术及其应用研究

来源 :西北工业大学 | 被引量 : 2次 | 上传用户:leefenbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的快速发展使得网络信息的传播增长十分迅猛,各类博客、论坛、社交网站中的图片大量涌入互联网致使图像数据库规模呈几何式倍增,想要从海量图像中准确而快速地搜索到用户真正需求的信息变得越来越困难。因此,高效的图像检索技术受到了极大关注,基于内容的图像检索技术成为当前研究热点之一。随着稀疏编码技术的不断发展以及处理图像的高效性使得该技术在图像各个领域得到了广泛应用。因此,基于稀疏编码的图像检索成为基于内容的图像检索中一项重要的研究课题。本文主要研究基于稀疏编码的图像检索,针对图像检索的视觉词袋(bag-of-visualwords,BOVW)模型忽略图像特征空间结构和直方图量化误差大的缺点,利用稀疏编码技术处理图像的高效性以及保留特征空间局部信息的有效性,同时考虑到特征空间几何结构的重要性,提出几种基于稀疏编码的图像检索算法。论文主要研究内容如下:(1)提出改进空间金字塔稀疏编码的图像检索算法。利用空间金字塔结构能够有效保留图像空间位置信息的优点,采用空间金字塔分割图像,将特征的局部性和编码的稀疏性融合用于构建稀疏正则项,计算凸优化的稀疏编码公式。为了获得更准确的检索结果,根据图像自身结构和相似度的两种计算方式提出一种相似度组合计算方法。该算法改善了BOVW模型忽略空间位置信息的缺点,提高了检索精度。(2)提出子区域视觉短语稀疏编码的图像检索算法。针对上述编码过程中字典的过完备性使得编码系数不唯一从而导致鲁棒性差的问题,构建一种视觉短语模型(bag-of-visual-phrases,BOVP)。通过角点和特征点对图像划分子区域,提取子区域特征并对其编码;计算子区域特征排列直方图,合并子区域编码和特征排列直方图,构建视觉短语;计算图像的视觉短语直方图,匹配相似度。该算法将编码的高效性和BOVW模型的鲁棒性结合,保留了特征的局部相关性,提升了检索的稳定性。(3)提出基于拉普拉斯稀疏编码的图像检索算法。稀疏编码独立的编码过程丢失了特征的局部相似信息,完全忽略了特征空间的几何结构,导致图像有较大的重构误差。利用拉普拉斯特征映射能够保留图像特征局部邻接关系的优点,将特征的局部信息和编码系数的相关性融合用来构建正则项。通过计算特征之间的距离获得相似度矩阵,并把相似度矩阵作为权值矩阵来定义拉普拉斯矩阵,计算拉普拉斯稀疏编码公式,采用特征符号搜索算法求解最优编码系数。该算法保证了相似的特征能够有相似的编码,提高了检索效率。(4)提出基于Hessian稀疏编码的图像检索算法。拉普拉斯稀疏编码的收敛速度很快,但它对复杂图像处理效果不好,因此结合Hessian特征映射能有效保留图像特征空间的局部流形结构的特点,将流形上的点映射到局部切空间,利用局部Hessian二次型定义二阶Hessian能量函数,构建基于Hessian特征映射的稀疏编码公式。为了更好地利用相邻特征之间的关系,受文本文档二元模型构造思想的启发,建立一种视觉短语模型——n-words模型,该模型提取的n-words序列作为一种高水平的视觉描述将被用于Hessian稀疏编码的特征表示。该算法增强了复杂图像的识别力,提升了检索效率的整体水平。(5)提出基于对称正定(symmetric positive definite,SPD)核稀疏编码的图像检索算法。由于Hessian特征映射需要估计二阶偏导数,这使得Hessian稀疏编码对噪声比较敏感,并且流形上局部切空间的计算较为复杂,所以Hessian稀疏编码的检索速度很慢。核方法不需要复杂的计算和近似估计便能有效处理黎曼流形的非线性结构,因此利用核方法的有效性,构建一种基于核的稀疏编码公式。将图像分割为8×8的子区域,提取所有子区域的SIFT特征,计算子区域协方差矩阵,构建SPD流形;根据Stein散度构建SPD核函数,运用核技术将SPD流形嵌入到再生核希尔伯特空间,获得基于SPD核的稀疏编码公式;采用迭代算法训练黎曼字典,求解最优编码系数。该算法不仅对复杂图像有较好的识别力,而且提升了检索速度。综上所述,本文研究的主要内容是基于稀疏编码的图像检索算法,通过有效利用图像的空间信息增强图像内容的视觉描述,并结合特征的多层语义信息提升图像的编码效率,从而提高图像的检索性能。
其他文献
曲齿锥齿轮是汽车驱动桥的关键零部件,目前两种齿制并存:一种是格里森制的弧齿锥齿轮(包括准双曲面齿轮),另一种是奥利康制的延伸外摆线锥齿轮(简称摆线锥齿轮)。曲齿锥齿轮制造水平的提高与制齿装备的技术进步密切相关。目前我国的曲齿锥齿轮高端制造装备依赖进口,购置价格高,刀具消耗大,导致齿轮制造成本居高不下,难于满足其大批量、低成本的市场需求。本文通过深入研究高端数控铣齿机加工曲齿锥齿轮的切齿原理,发现其
近几年来在算术数列的研究中有着重大的进展,例如B.Green与T.Tao证明了素数中存在任意长度的算术数列.在这些结果中Gowers范数起到了重要的作用,因此对其进行进一步的研究是有意义的.此外,伪随机二进制数列在密码学中流密码的构造方面也起着重要的作用,我们需要不停的构造新的数列以应付各方面的需求.本文研究了Gowers范数、伪随机二进制数列与D.H.Lehmer问题,以及这几个领域之间的关系,
无线传感器网络(wireless sensor network,WSN)定位是指在给定或获取足够多的邻节点之间信息基础上进行节点位置坐标估计的过程。由于节点位置信息是绝大多数应用所必需的,同时也是不少网络协议和算法设计的支撑信息。因此该领域多年来一直是WSN的研究热点。目前虽然已有不少定位算法提出,但是该领域的研究仍存在不少薄弱环节。一方面,WSN定位算法复杂度过大、具体实现起来比较困难;另一方面
1970年,Stein在“第十六届国际数学家大会”上提出利用群分析研究H?rmander型偏微分算子的思想,从此Carnot群上各种偏微分算子逐渐成为新的研究热点。本文主要研究Carnot群上Schr?dinger型算子和抛物Schr?dinger型算子的Orlicz估计,以及具不连续系数Schr?dinger型算子的Lp估计。本文由以下三部分组成。第一部分(第二章和第三章)研究Carnot群上如
为了确保所设计工程结构的可靠性和安全性,掌握其所处的动载荷环境是一项非常重要且必须的工作。在工程实际中,作用在结构上的动载荷是难以直接测量,甚至是无法测量的。为此,人们发展出动载荷识别方法。动载荷识别方法的提出和发展不仅具有重要的学术意义而且具有工程实用价值。本文致力于研究分布动载荷识别方法及其在抖振载荷预计中的应用,主要解决如下四方面的问题:(1)多点平稳随机动载荷识别及识别误差的分析与控制;(
学位
本研究以菘蓝(Isatis indigotica Fort)为实验材料,运用生物化学、分子生物学、热分析(DTA、TG和DTG)以及热力学等方法研究了He-Ne激光辐照(5.23mW·mm-2)菘蓝种子的生物学效应、He-Ne激光辐照对增强UV-B(10.08KJ.d-1)辐射损伤菘蓝幼苗的防护、修复效应及激光对生物学的作用机制。该研究从生理水平、生化水平、分子水平、个体生长发育以及板蓝根与大青叶
固冲发动机被认为是中等超声速、中远程战术导弹的理想动力装置,但现行固冲发动机普遍采用固定几何简单结构方案,流道结构按照低速接力条件设计,高速巡航飞行时性能损失严重。因此提出复合调节固冲发动机的概念,通过进气道/燃气发生器/喷管复合调节提升发动机性能。固冲发动机的工作特性要求必须对其复合调节过程进行有效地控制,但由于可控变量、动态特性以及控制目标等方面的变化,现有方法无法实现对发动机工作状态的有效控
TC4合金是一种中等强度的两相钛合金,该合金具有优异的综合性能,在航空航天领域主要用于制造发动机的风扇、压气机盘及叶片,因而多服役于高温、高压等严苛环境。随着航空航天的迅速发展,对TC4合金的性能和使用可靠性提出了更高的要求。TC4合金的主要失效形式一般始于其表面,因而制备出一定厚度的纳米结构表层,即表面纳米化,就能够发挥纳米晶的优势而提高其整体性能和服役寿命。基于上述目的,本文研究了采用喷丸方法
学位