基于视觉特征提取的图像检索算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:hiketty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字图像的快速和大规模增长,人们找到感兴趣的图像越发困难,这促使人们研究和开发有效的图像存储,索引和检索技术。图像检索和索引已被应用于许多领域,例如互联网、广告、艺术、建筑、教育、医疗、生物和其他许多行业。基于文本的图像检索首先以文本形式手工标记图像,然后使用关键字来检索图像。这种基于字符匹配程度的图像检索方法既主观又费时。基于内容的图像检索方法克服了基于文本方法的缺点,依据图像的视觉特征(颜色,纹理,形状等)在图像集中找到相似的图像(搜索范围)。本文针对图像检索的视觉特征提取的关键性问题,提出了彩色能量导向局部模式、稳定兴趣点区域、一致性区域内主颜色及胡矩,以及结合区域相关和方向相关描述符等算法进行图像检索,做了深入研究,取得的研究成果和创新如下:1.提出了彩色能量导向局部模式特征和直方图结合的图像检索算法。局部二值模式(Local Binary Patterns)是一种著名的表征图像纹理特征的算子,它和它派生的各种算子在图像检索中取得很好的效果,但它们基本上都是对彩色图像中的亮度单通道进行处理,没有利用彩色图像的颜色特征。本文针对彩色图像提出一种彩色能量导向局部模式(Local Color Energy Oriented Pattern),它基于彩色多通道,以彩色图像有限区域能量变化为导向,考虑图像中参考区域和它对应最大能量变化方向处目标区域中对应点处强度的关系,动态的表示图像局部纹理变化特征,较二值模式(LBP)等相应算子只是考虑局部邻域中心点和周围点强度的关系能够表现纹理的变化信息。再将彩色能量导向局部模式特征和图像颜色常用的直方图(Color Histogram)特征结合能更好的表征图像的特征信息。所提方法(LCEOPa CH)在corel-1k、corel-5k和corel-10k三个数据集上进行测试,实验结果表明优于当今的其它基于内容的图像检索方法。2.提出了稳定兴趣点区域图像检索算法。针对传统兴趣点检索方法中非感兴趣区域的兴趣点会降低检索准确率的不足,提出稳定兴趣点区域检索图像的新方法。首先检测查询图像和候选图像的兴趣点,提取其邻域灰度信息并计算伪泽尼克矩,通过比较距离找到最佳匹配点对。其次以匹配点对计算相应凸包区域以得到稳定的兴趣点区域。最后提取稳定兴趣点区域内图像颜色和Gabor小波变换纹理信息进行图像检索。实验结果表明所提算法去除了无关兴趣点的影响,克服了传统兴趣点算法只提取边缘局部特征的不足,与同类算法相比准确率明显提高。3.提出了一致性区域主颜色及胡矩图像检索算法。数量快速增长的数字图像需要有效的检索,主颜色描述符(Dominant Color Descriptor,DCD)在图像处理中已得到广泛使用。但是主颜色描述符考虑的是整幅图像上的所有像素点信息,从而影响了检索的准确率。根据基元理论(The texton theory),先采用基元模板检测提取出图像一致性区域内像素点的信息,并在此区域内的像素点上计算主颜色特征。然后再结合具有平移和旋转不变性的胡矩特征提取图像中的形状信息,从而达到有效结合颜色和形状信息进行图像检索。所提的算法在corel-1k、corel-5k和corel-10k三个数据集上进行测试,实验结果表明优于当今的基于内容的图像检索方法。4.提出了结合区域相关和方向相关描述符的图像检索算法。大量不断增长的数字图像需要有效地检索,但是在准确性和速度之间进行权衡是一个棘手的问题。通过结合区域相关和方向相关描述符(Combining Region and Orientation Correlation Descriptors,CROCD)提出了一种快捷有效的图像检索方法。区域颜色相关模式和方向颜色相关模式分别由区域相关描述符和方向相关描述符提取。然后分别从两个相关模式中提取图像的特征向量。该算法具有统计和纹理描述方法的优点,可以表示图像颜色和纹理在空间的相关性。对于全彩色图像,特征向量只有80维。因此,它在图像检索中非常高效。该算法在准确性和查全率方面在三个数据集上进行了的测试。实验结果表明,所提出的算法优于其他最新算法。
其他文献
新辅助治疗(neoadjuvant therapy,NAT)后进行全直肠系膜切除(total mesorectal excision,TME)手术是局部进展期直肠癌(locally advanced rectal cancer,LARC)患者的标准治疗方案。在接受了NAT后,大约有50%至60%的LARC患者实现了肿瘤分期降低且有大约20%的患者能够达到病理学完全缓解,随后进行的TME手术能够有效
拓扑性质是复杂网络不依赖于节点的具体位置和边的具体形态就能表现出来的性质,其相应的结构叫做网络的拓扑结构。任何复杂系统都可以抽象成为由相互作用的个体组成的网络,因而网络无处不在,遍及自然界和人类社会。复杂网络的拓扑结构是人们理解网络本身的特性、网络中节点的行为以及节点之间的相互影响等的基础,也是很多领域如复杂网络的统计特性、节点特征提取、节点分类/聚类等的研究基础。对于物理学家而言,研究复杂网络的
第三代合作伙伴计划(third Generation Partnership Project,3GPP)成立于1998年,从最初的通用移动通信系统网络,到长期演进(Long Term Evolution,LTE)网络、LTE网络的后续演进(LTE-Advanced,LTE-A)网络,再到当前主流发展的第五代移动通信技术(fifth Generation,5G)网络,3GPP已成长为全球最大的通信标
流形优化在应用数学、统计学、工程、机器学习等领域有着广泛的应用.利用流形的拓扑结构和几何性质,可以将线性空间上的约束优化问题看做流形上的无约束优化问题;通过引入适当的黎曼度量,也可以将线性空间上的非凸优化问题转化为流形上的凸优化问题.许多实际应用中数据的自然结构常常建模为约束优化问题,其约束是黎曼流形.为此,人们一方面研究子流形的拼挤性质以简化数据的建模结构.另一方面研究黎曼流形上的优化理论继而构
人们对于世界的认知往往是通过二维以及三维图像。当下,人们对图像信息质量的要求越来越高,但是由于一些客观因素比如遮挡,反光,暗环境等条件,设备难免会采集到低质量的图像图形信息。这些低质量的图像一方面对人类视觉系统不友好,另一方面也不利于计算机视觉的下游任务,诸如图像分类,图像分割,目标检测等。所以,对低质量的图像图形信息进行修复是十分有必要且有意义的工作。类似的,三维图形也可能由于扫描角度限制等问题
大数据时代需要存储和处理的数据量呈现爆发式增长,而传统基于浮栅结构的存储器和基于冯.诺依曼构架的计算器已经达到技术瓶颈,发展逐渐变缓,因此寻找新的存储器件取代现有的浮栅式存储器以及发展新的计算系统已经成为学术领域和工业领域关注的重点。忆阻器尤其是阻变忆阻器因其速度快、能耗小、集成度密高、保持时间长以及能够实现对神经突触功能模拟等优点,被认为是下一代存储器和类脑计算网络最有力的竞争者。本文以基于Hf
微波光子学技术可用于实现微波信号产生、传输、处理、控制、变频等功能,是下一代无线通信、雷达探测、卫星通信、深空探测、卫星有效载荷以及电子战等领域不可或缺的重要模块;其可广泛用于高频微波信号产生、光纤色散补偿、镜像抑制、多普勒频移(Doppler Frequency Shift,DFS)测量等技术。而随着电子系统业务量的增加,信息传输速率的要求也越来越高,且现在系统越来越向高性能、一体化、多频段信号
海杂波是对海雷达照射海面接收到的后向散射回波,基于匹配统计模型的海杂波特性精确估计理论是不同对海雷达探测工作中实现有效目标检测及跟踪过程的关键基础。在高分辨率、低擦地角的对海雷达工作场景中,利用纹理分量服从不同概率分布的各类复合高斯模型可以有效地描述海杂波回波的统计特性,其中包括K分布模型、广义Pareto分布模型(Generalized Pareto Distribution Model,GPD
为了便于系统分析与综合,人们通常需要对物理系统进行一定层次的简化及抽象,并在此基础上建立相应的数学模型。离散事件系统是人们对异步发生的离散驱动的物理系统的一种抽象。随着信息化水平的不断提高,特别是数字计算机控制的制造技术的不断发展,离散事件系统大量涌现,如通讯网络、柔性制造系统、物流管理系统以及火车和航空调度系统等。这些系统都是典型的离散事件系统,这些系统中事件的发生都具以下共同特征:异步性、顺序
随着互联网、物联网等技术的飞速发展,在社会生活的各个领域,涌现出海量的多视角数据。多视角数据指的是同一对象从不同途径或不同层面获得的特征数据,其呈现出多态性、多源性、多描述性和高维异构性等特点。例如自动驾驶中,车辆通过摄像头、激光雷达等多个传感器收集到的多视角数据感知周围环境。多视角学习方法利用了视角之间信息的互补性,对多视角信息进行多层面的处理,获得对事物的全面理解,这是单视角方法无法比拟的。由