论文部分内容阅读
【摘要】随着科技的发展,需要检索的图像的数量也急剧增多,如何用快速便捷的方式检索图片,方便我们的生活和工作显得尤为重要。目前对基于内容的图像检索技术与系统的研究卓有成效。
【关键词】科技发展;图像;检索技术与系统;研究
中图分类号:TP752文献标识码: A 文章编号:
前言
文章就传统的图像信息索引技术和基于内容的图像索引技术分部进行了介绍,对图像索引技术与系统从各方面进行剖析,同时结合自身实践经验和相关理论知识,分析了基于内容的图像检索技术的未来发展方向。
二、传统图像信息检索技术的弊端
传统图像检索技术主要是通过对图像进行人工分析、对图像物理特征和内容特征进行文字著录或标引、建立类似于文本文献的标引著录数据库,并通过检索这些数据库以获得图像编号、进而利用这些编号索取实际图像。由于图像信息处理与文字信息处理存在本质区别,上述传统技术存在以下弊端:有关特征人工抽取,不能充分揭示和描述信息中有代表性的特征;特征描述容易带主观性;人工处理速度慢;检索中不能充分利用各种特征,包括事先人们没有注意到的特征将被完全忽略;不能快速提供检索结果的相关信息。
三、基于内容的图像检索的概念
图像检索依靠对图像特征进行标引和检索所谓图像特征.包括图像的画面内容特征:例如图像颜色分布、纹理结构、轮廓等;图像的主题对象特征,例如图像所描述的人、车、建筑等;图像的著录特征,例如作者、时间、地点及其它物理特征;以及图像的移动和组合特征,例如影象中反映的场景。传统图像检索将注意力局限在图像的著录特征上一而基于内容的图像检索技术则主要依据图像的画面内容特征和主题对象特征(即图像的实际内容)来进行检索。这种技术依靠计算机自动抽取图像特征和编制特征索引,检索时可依据用户输人的图像某一特征(例如绘制的草图、轮廓图或调用的相似图像)自动比较特征索引库中的对应特征信息.将最佳匹配结果和相关信息输出。
基于内容的图像检索技术与系统的具体内容
1.基于颜色特征的检索
颜色是图像最底层、最直观的物理特征,一般采用颜色直方图、颜色相关图、颜色矩、颜色一致性矢量等方法来描述。目前基于颜色特征的检索是应用最为广泛的检索方法,主要分为两类:全局颜色特征检索和局部颜色特征检索。
(一)全局颜色特征检索方法目前主要使用色彩直方图的方法,它是Swain和Ballad提出的,这种方法是根据色彩直方图统计每种色彩在图像中出现的概率,然后采用色彩直方图的交来度量两幅图像色彩的相似性,其缺点是不能反应图像颜色的空间分布。基于这个缺点,很多人提出了改进的方法:Pass和Zabih等人提出以图像的色彩聚合矢量作为图像的索引,是图像直方图的一种演变,聚合矢量中的聚合信息在某种程度上保留了图像色彩的空间信息。Stricker和Orengo等提出累加直方图法,将图像分成若干区域,分别对每个区域计算其颜色直方图,图像检索就变成区域颜色直方图距离的计算,极大地提高检索的准确性;同时他们又提出了色彩矩的方法,认为色彩信息主要集中在图像色彩的低阶矩中。这种方法主要对图像的每种色彩分量的一阶、二阶和三阶矩进行统计。Hafner等提出了分级检索策略,并获得较好的效果。
(二)全局直方图因其不包含颜色的空间分布关系,往往造成误检。局部直方图方法可以弥补这个缺点,其基本思想是将图像进行分块,计算每一个子块的颜色直方图,然后比较两幅图像相应子块间的相似距离并进行求和作为整幅图像的相似距离值。但子块间的空间约束关系太强,丢失了全局颜色直方图所具有的旋转、平移不变性的优点。基于此,Stricker等提出将图像划分成5块互相交叠的区域(考虑图像中象素间的相关性),通过对区域中间的象素和靠近边界的象素设置不同的权重,只能做到有限的旋转不变性。
2.基于纹理的图像检索
纹理特征反映的是图像的一种局部结构化特征,具体表现为图像像素点局部邻域内像素点灰度级或者颜色的某种变化,而且这种变化是空间统计相关的。纹理分析的典型方法有空间域纹理分析和频率域纹理分析。随着小波变换在图像纹理分析中的广泛应用,人们也开始采用小波变换后的系数作为图像的索引。提取二进制小波系数的一阶、二阶统计矩(共生矩阵)作为图像纹理特征,取得了很好的检索效果。结合图像的频域统计特征和空间分布特征,通过小波变换提取图像的局部频域信息,结合图像的整体结构特征,构建了小波灰度共生矩阵,实验证明比单独使用其它灰度共生矩阵和小波特征检索效果都好。
3.基于形状特征的检索
形状是刻画物体最本质的特征。形状特征有面积、主轴方向、环形性、连通性、偏心率等。对形状特征的提取主要是寻找一些几何不变量。目前用于图像检索的形状描述方法主要有两类:基于边缘和基于区域的形状方法。前者利用图像的边缘信息,而后者则利用区域内的灰度分布信息。在基于形状的图像检索中,要解决三个间题。首先,形状通常与图像中的特定目标对象有关,因此形状比颜色和纹理的语义性更强,要获得目标的形状参数,先要进行图像分割,所以形状特性会受到图像分割效果的影响。其次,目标形状的描述是一个非常复杂的问题。人对形状的感觉是视网膜感受和现实世界的知识相结合的结果。事实上,目前还没有找到与人的主观感觉相一致的形状模型。最后,视角不同所获得的形状可能会有很大区别,为能准确匹配形状,就要解决平移、缩放、旋转中的不变性等问题。
4.基于语义特征的检索
在实际的查询中,人们更习惯于依据图像所描述的对象或事件的语义信息进行图像相似性判别的,而非是图像低层视觉特征的相似。这就造成了人所理解的“语义相似”与计算机理解的“视觉相似”之间的“语义鸿沟”的产生。基于语义特征的检索方法的目标是最大限度地减小这种语义鸿沟。目前主要采用半自动或手动的方法提取语义特征。
五、基于内容的图像检索技术与系统的进一步研究方向
基于内容的图像检索技术虽然在数据库图像检索领域得到了广泛的应用,但是目前这方面的技术还十分不成熟,仍需进一步研究:
1.针对图像的颜色特征的提取问题,应从颜色的物理、视觉、心理等方面进行综合深入的研究,同时要考虑降低颜色特征的维数。
2.针对图像纹理特征的提取问题,应尽量减少所选纹理特征对具体纹理图像的依赖程度,研究不同的纹理库图像进行纹理特征集的自动切换问题。
3.针对图像形状特征的提取问题,应减少图像分割对形状特性的影响。其次,目标形状的描述也是一个复杂的问题,人对形状的感觉是视网膜感受和现实世界的知识相结合的结果,因此应致力于研究与人的主观感觉相一致的形狀模型。
4.目前,基于语义的图像检索成为研究的热点,但是如何解决图像的底层特征和高层语义之间的语义鸿沟仍是困扰研究人员的主要问题。
5.图像的检索效果需要交给用户进行评判,而用户将查询结果的评判信息反馈给计算机。因此,如何设计用户的反馈方式和充分利用反馈信息需要深入研究。
六、结束语
基于内容的图像检索技术与系统研究,研究时间还不是很长,因此图像检索技术还存在很多的缺陷,相应的理论体系还没有成型,这需要我们积极的探索和努力。
参考文献:
[1]孙君项,赵珊.图像低层特征提取与检索技术[J].2O09.
[2]孟祥娜,秦玉平,王春立.基于内容的图像检索技术综述[J].渤海大学学报,2009(30).
[3]叶志伟,夏彬,周欣,张彦超.一种改进的基于颜色直方图的图像检索算法.吉首大学学报,2009(30).
[4]金莲芳,覃团发,王海霞.基于结构量化直方图的图像检索方法[J].中国图像形,2006.
【关键词】科技发展;图像;检索技术与系统;研究
中图分类号:TP752文献标识码: A 文章编号:
前言
文章就传统的图像信息索引技术和基于内容的图像索引技术分部进行了介绍,对图像索引技术与系统从各方面进行剖析,同时结合自身实践经验和相关理论知识,分析了基于内容的图像检索技术的未来发展方向。
二、传统图像信息检索技术的弊端
传统图像检索技术主要是通过对图像进行人工分析、对图像物理特征和内容特征进行文字著录或标引、建立类似于文本文献的标引著录数据库,并通过检索这些数据库以获得图像编号、进而利用这些编号索取实际图像。由于图像信息处理与文字信息处理存在本质区别,上述传统技术存在以下弊端:有关特征人工抽取,不能充分揭示和描述信息中有代表性的特征;特征描述容易带主观性;人工处理速度慢;检索中不能充分利用各种特征,包括事先人们没有注意到的特征将被完全忽略;不能快速提供检索结果的相关信息。
三、基于内容的图像检索的概念
图像检索依靠对图像特征进行标引和检索所谓图像特征.包括图像的画面内容特征:例如图像颜色分布、纹理结构、轮廓等;图像的主题对象特征,例如图像所描述的人、车、建筑等;图像的著录特征,例如作者、时间、地点及其它物理特征;以及图像的移动和组合特征,例如影象中反映的场景。传统图像检索将注意力局限在图像的著录特征上一而基于内容的图像检索技术则主要依据图像的画面内容特征和主题对象特征(即图像的实际内容)来进行检索。这种技术依靠计算机自动抽取图像特征和编制特征索引,检索时可依据用户输人的图像某一特征(例如绘制的草图、轮廓图或调用的相似图像)自动比较特征索引库中的对应特征信息.将最佳匹配结果和相关信息输出。
基于内容的图像检索技术与系统的具体内容
1.基于颜色特征的检索
颜色是图像最底层、最直观的物理特征,一般采用颜色直方图、颜色相关图、颜色矩、颜色一致性矢量等方法来描述。目前基于颜色特征的检索是应用最为广泛的检索方法,主要分为两类:全局颜色特征检索和局部颜色特征检索。
(一)全局颜色特征检索方法目前主要使用色彩直方图的方法,它是Swain和Ballad提出的,这种方法是根据色彩直方图统计每种色彩在图像中出现的概率,然后采用色彩直方图的交来度量两幅图像色彩的相似性,其缺点是不能反应图像颜色的空间分布。基于这个缺点,很多人提出了改进的方法:Pass和Zabih等人提出以图像的色彩聚合矢量作为图像的索引,是图像直方图的一种演变,聚合矢量中的聚合信息在某种程度上保留了图像色彩的空间信息。Stricker和Orengo等提出累加直方图法,将图像分成若干区域,分别对每个区域计算其颜色直方图,图像检索就变成区域颜色直方图距离的计算,极大地提高检索的准确性;同时他们又提出了色彩矩的方法,认为色彩信息主要集中在图像色彩的低阶矩中。这种方法主要对图像的每种色彩分量的一阶、二阶和三阶矩进行统计。Hafner等提出了分级检索策略,并获得较好的效果。
(二)全局直方图因其不包含颜色的空间分布关系,往往造成误检。局部直方图方法可以弥补这个缺点,其基本思想是将图像进行分块,计算每一个子块的颜色直方图,然后比较两幅图像相应子块间的相似距离并进行求和作为整幅图像的相似距离值。但子块间的空间约束关系太强,丢失了全局颜色直方图所具有的旋转、平移不变性的优点。基于此,Stricker等提出将图像划分成5块互相交叠的区域(考虑图像中象素间的相关性),通过对区域中间的象素和靠近边界的象素设置不同的权重,只能做到有限的旋转不变性。
2.基于纹理的图像检索
纹理特征反映的是图像的一种局部结构化特征,具体表现为图像像素点局部邻域内像素点灰度级或者颜色的某种变化,而且这种变化是空间统计相关的。纹理分析的典型方法有空间域纹理分析和频率域纹理分析。随着小波变换在图像纹理分析中的广泛应用,人们也开始采用小波变换后的系数作为图像的索引。提取二进制小波系数的一阶、二阶统计矩(共生矩阵)作为图像纹理特征,取得了很好的检索效果。结合图像的频域统计特征和空间分布特征,通过小波变换提取图像的局部频域信息,结合图像的整体结构特征,构建了小波灰度共生矩阵,实验证明比单独使用其它灰度共生矩阵和小波特征检索效果都好。
3.基于形状特征的检索
形状是刻画物体最本质的特征。形状特征有面积、主轴方向、环形性、连通性、偏心率等。对形状特征的提取主要是寻找一些几何不变量。目前用于图像检索的形状描述方法主要有两类:基于边缘和基于区域的形状方法。前者利用图像的边缘信息,而后者则利用区域内的灰度分布信息。在基于形状的图像检索中,要解决三个间题。首先,形状通常与图像中的特定目标对象有关,因此形状比颜色和纹理的语义性更强,要获得目标的形状参数,先要进行图像分割,所以形状特性会受到图像分割效果的影响。其次,目标形状的描述是一个非常复杂的问题。人对形状的感觉是视网膜感受和现实世界的知识相结合的结果。事实上,目前还没有找到与人的主观感觉相一致的形状模型。最后,视角不同所获得的形状可能会有很大区别,为能准确匹配形状,就要解决平移、缩放、旋转中的不变性等问题。
4.基于语义特征的检索
在实际的查询中,人们更习惯于依据图像所描述的对象或事件的语义信息进行图像相似性判别的,而非是图像低层视觉特征的相似。这就造成了人所理解的“语义相似”与计算机理解的“视觉相似”之间的“语义鸿沟”的产生。基于语义特征的检索方法的目标是最大限度地减小这种语义鸿沟。目前主要采用半自动或手动的方法提取语义特征。
五、基于内容的图像检索技术与系统的进一步研究方向
基于内容的图像检索技术虽然在数据库图像检索领域得到了广泛的应用,但是目前这方面的技术还十分不成熟,仍需进一步研究:
1.针对图像的颜色特征的提取问题,应从颜色的物理、视觉、心理等方面进行综合深入的研究,同时要考虑降低颜色特征的维数。
2.针对图像纹理特征的提取问题,应尽量减少所选纹理特征对具体纹理图像的依赖程度,研究不同的纹理库图像进行纹理特征集的自动切换问题。
3.针对图像形状特征的提取问题,应减少图像分割对形状特性的影响。其次,目标形状的描述也是一个复杂的问题,人对形状的感觉是视网膜感受和现实世界的知识相结合的结果,因此应致力于研究与人的主观感觉相一致的形狀模型。
4.目前,基于语义的图像检索成为研究的热点,但是如何解决图像的底层特征和高层语义之间的语义鸿沟仍是困扰研究人员的主要问题。
5.图像的检索效果需要交给用户进行评判,而用户将查询结果的评判信息反馈给计算机。因此,如何设计用户的反馈方式和充分利用反馈信息需要深入研究。
六、结束语
基于内容的图像检索技术与系统研究,研究时间还不是很长,因此图像检索技术还存在很多的缺陷,相应的理论体系还没有成型,这需要我们积极的探索和努力。
参考文献:
[1]孙君项,赵珊.图像低层特征提取与检索技术[J].2O09.
[2]孟祥娜,秦玉平,王春立.基于内容的图像检索技术综述[J].渤海大学学报,2009(30).
[3]叶志伟,夏彬,周欣,张彦超.一种改进的基于颜色直方图的图像检索算法.吉首大学学报,2009(30).
[4]金莲芳,覃团发,王海霞.基于结构量化直方图的图像检索方法[J].中国图像形,2006.