论文部分内容阅读
摘要:科技资源具有海量、复杂、异构、地理分布广的特点,为了高效查找和使用科技资源的图像,指出综合运用TBIR(基于文本的图像检索)和CBIR(基于内容的图像检索)共同检索科技资源图像,并列举了较为先进的图像检索系统,探讨了科技资源图像检索模型。
关键词:科技资源;图像检索;TBIR;CBIR
中图分类号:TP302文献标识码:A文章编号:1009-3044(2007)06-11725-02
1 引言
2005年,河北省科技厅启动了“河北省科技基础平台”(以下简称“科技平台”)项目,其目的是实现我省科技资源的有效整合、共享和服务。《科技资源数据库建设》(以下简称“科技资源”)是科技平台建设课题之一,是融合了河北省的气候资源、农业资源、水文资源、微生物资源、地理资源和动植物资源等科技资源为一体的大型数据库系统。现阶段我们已经进行了气候资源、农业资源、地理资源和动植物资源信息的收集、规范。
现以野生植物资源为例,目前已有3000多种野生高等植物,2000多幅约700来种各类野生植物的图片,并且图像的尺寸和格式等均有不同,为了使科技资源数据库中庞杂的图像所包含的信息被有效的访问和利用,必然需要一种能够快速而且准确的查找访问图像的技术,即图像的检索技术。
2 图像检索技术的发展
图像检索技术的发展大体上经过了两个阶段:自20世纪70年代始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),利用文本描述图像的特征;90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、形状等进行分析和检索的图像检索技术,即基于内容的图像检索(Content-based Image Retrieval,简称CBIR)。
2.1 TBIR
TBIR的基本思想是,用文本作为关键字索引,利用基于文本的数据库管理系统(DBMS)管理图像的文本信息。其沿用了传统文本检索技术,回避图像语义分析,使用文本描述的形式从图像名称、尺寸大小、压缩类型、主题内容等方面标引图像,一般以分类目录浏览或者是关键词提问的形式检索。
对于科技资源的图像而言,图像的物理特征信息可以通过资源提供单位提供的信息自动识别,如图像的名称、格式类型、尺寸大小等。目前一些TBIR系统原型已发布到Internet上,因此可以参考这些成熟技术的算法并针对科技资源的特点来实现TBIR,以下是应用该技术的几种典型的图像搜索引擎 [2] 。
(1)Yahoo! Picture-Gallery:雅虎图像馆目前有40余万幅图像。这些图像按动物、艺术、文化娱乐、自然、科技、体育运动和旅游等进行分类组织,供用户浏览、挑选。用户还可以在检索框输入关键词进行图像检索。网址http://gallery.yahoo.com/;
(2)Ditto:Ditto是一个纯粹的图像搜索引擎。它的图像索引(Picture Index)库与日俱增。其来源:一是图像拥有者以页面URL地址提供,二是靠它的搜索软件搜索Web空间的图像。其网址是http://www.ditto.com/。
2.2 CBIR
CBIR的基本思想是,根据图像的一些低级视觉特征,如颜色、纹理、图像对象的形状以及它们之间的空间关系等内容特征作为图像的索引,计算基准查询图像和图像数据库中图像的相似距离,按照相似度匹配进行检索。目前,有关CBIR技术研究已经取得了很大的突破,比较有代表性的图像检索系统如下:
(1)QBIC:QBIC[3]是IBM公司在90年代开发的图像和动态影像检索系统,支持基于Web的图像检索服务。系统中以图像、视频及其对象的颜色、纹理、形状、运动等为查询的关键特征,还提供图形化的查询语言,查询的提出通过绘画、选择和其它图形化的途径来完成。其网址是http://www.qbic.almaden.ibm.com/;
(2)Virage :Virage[4]是由Virage公司开发的基于内容的图像搜索引擎。它支持颜色、颜色布局、纹理和形状四个原子查询的任意组合,用户可根据自己的侧重调整这四个原子查询的权重,以获得个性化的查询结果。其网址是http://www.virage.com。
3 TBIR与CBIR结合检索与科技资源图像
3.1 TBIR、CBIR对比分析
TBIR、CBIR有着各自的优势和不足,对于科技资源这个特定应用背景,TBIR在一定程度上回避了对复杂的可视化元素的识别难题,符合人们熟悉的检索习惯,充分利用了科技资源文本结构信息,实现简单,但是因为仍旧局限在文本检索的范围下,通过受控词汇来描述图像,因此容易出现主题歧义、标引不一、无法对图像内容理解等问题。CBIR恰相反,主要利用对直观形象的特征元素的分析来标引图像,具有一定的客观性,如每幅图像的色彩直方图是确定的,但是CBIR算法复杂,实现成本高。因而TBIR与CBIR结合运用才能促进简单、高效检索科技资源图像的实现。
3.2 TBIR与CBIR结合检索科技资源图像
一个有效的科技资源图像检索系统应该能够模拟选取主观多样性,要便于根据不同用户的标准进行调整。这就要求将文字描述和图像低层属性进行合理利用 [5] 。为此有机整合TBIR和CBIR,构建一个科技资源图像检索系统,使二者互为补充,这样的系统就可以同时获取科技资源图像的低层和高层特征。使用户可以根据需求通过关键词开始检索一个查询,而返回结果后再选择可以作为查询样图的图像进行基于内容属性的检索。科技资源图像检索模型如图1所示。
图1 科技资源图像检索模型
本检索模型,从功能上划分主要可以分为图像管理模块、图像处理模块和图像查询模块。图像管理模块:主要包含图像库的管理,图像的管理极其相关算法管理。图像库管理首先将科技资源中的每幅图像进行图像元数据和文本描述信息的生成,形成图像库;图像管理是对单张图像进行归档;算法管理则是对图像格式、文件格式极其相关数据进行处理。图像处理模块:是本检索模型的关键模块。它主要完成对图像的分析处理功能,即按照相应算法提取图像的特征,建立图像的特征库。同样对待查图像也提取相应的图像特征。图像查询模块:是本检索模型完成图像查询功能模块。将待查图像的特征提取和图像特征库中的特征进行模式匹配,提供查询结果。查询模块提供若干查询条件,是本检索模型的人机交互部分。
4 结束语
本文结合河北省科技基础条件平台中科技资源图像检索的需求,利用TBIR与CBIR相结合的思想,设计了科技资源图像检索模型,使多种种质资源图像信息能够方便查询检索,屏蔽了科技资源图像庞杂的差异,实现了科技资源图像信息的统一表示、统一访问,在技术上有很大的创新。同时,本文对图像特征提取是建立在图像元数据和文本描述信息生成的基础之上,提高了科技资源的查询性能,使得对图像的检索向标准化建设靠近提供了一个创造性实验,并在试运行中取得较好的效果。
参考文献:
[1]李建生.图像元数据特征提取及其在检索中的应用[J].南京师范大学,2005,6.
[2]王振海, 刘庆虎.基于www的图像搜索引擎[J].福建电脑,2005,2:18-19.
[3]Myron Flickner, Harpreef Sawhney, Query by Image and Video Content: The QBIC System, IEEE Computer,1995,28:23-32.
[4]J R Back, C Fuller.The Virage Image Search Engine: An Open Framework for Image Management. In Proc. SPIE: Storage and Retrieval for Still Image and Video Databases,1996,4:76-87.
[5]周文昭, 夏定元.基于内容的图像检索系统的最新进展[J].计算机工程与应用,2003:112-115.
本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。
关键词:科技资源;图像检索;TBIR;CBIR
中图分类号:TP302文献标识码:A文章编号:1009-3044(2007)06-11725-02
1 引言
2005年,河北省科技厅启动了“河北省科技基础平台”(以下简称“科技平台”)项目,其目的是实现我省科技资源的有效整合、共享和服务。《科技资源数据库建设》(以下简称“科技资源”)是科技平台建设课题之一,是融合了河北省的气候资源、农业资源、水文资源、微生物资源、地理资源和动植物资源等科技资源为一体的大型数据库系统。现阶段我们已经进行了气候资源、农业资源、地理资源和动植物资源信息的收集、规范。
现以野生植物资源为例,目前已有3000多种野生高等植物,2000多幅约700来种各类野生植物的图片,并且图像的尺寸和格式等均有不同,为了使科技资源数据库中庞杂的图像所包含的信息被有效的访问和利用,必然需要一种能够快速而且准确的查找访问图像的技术,即图像的检索技术。
2 图像检索技术的发展
图像检索技术的发展大体上经过了两个阶段:自20世纪70年代始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),利用文本描述图像的特征;90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、形状等进行分析和检索的图像检索技术,即基于内容的图像检索(Content-based Image Retrieval,简称CBIR)。
2.1 TBIR
TBIR的基本思想是,用文本作为关键字索引,利用基于文本的数据库管理系统(DBMS)管理图像的文本信息。其沿用了传统文本检索技术,回避图像语义分析,使用文本描述的形式从图像名称、尺寸大小、压缩类型、主题内容等方面标引图像,一般以分类目录浏览或者是关键词提问的形式检索。
对于科技资源的图像而言,图像的物理特征信息可以通过资源提供单位提供的信息自动识别,如图像的名称、格式类型、尺寸大小等。目前一些TBIR系统原型已发布到Internet上,因此可以参考这些成熟技术的算法并针对科技资源的特点来实现TBIR,以下是应用该技术的几种典型的图像搜索引擎 [2] 。
(1)Yahoo! Picture-Gallery:雅虎图像馆目前有40余万幅图像。这些图像按动物、艺术、文化娱乐、自然、科技、体育运动和旅游等进行分类组织,供用户浏览、挑选。用户还可以在检索框输入关键词进行图像检索。网址http://gallery.yahoo.com/;
(2)Ditto:Ditto是一个纯粹的图像搜索引擎。它的图像索引(Picture Index)库与日俱增。其来源:一是图像拥有者以页面URL地址提供,二是靠它的搜索软件搜索Web空间的图像。其网址是http://www.ditto.com/。
2.2 CBIR
CBIR的基本思想是,根据图像的一些低级视觉特征,如颜色、纹理、图像对象的形状以及它们之间的空间关系等内容特征作为图像的索引,计算基准查询图像和图像数据库中图像的相似距离,按照相似度匹配进行检索。目前,有关CBIR技术研究已经取得了很大的突破,比较有代表性的图像检索系统如下:
(1)QBIC:QBIC[3]是IBM公司在90年代开发的图像和动态影像检索系统,支持基于Web的图像检索服务。系统中以图像、视频及其对象的颜色、纹理、形状、运动等为查询的关键特征,还提供图形化的查询语言,查询的提出通过绘画、选择和其它图形化的途径来完成。其网址是http://www.qbic.almaden.ibm.com/;
(2)Virage :Virage[4]是由Virage公司开发的基于内容的图像搜索引擎。它支持颜色、颜色布局、纹理和形状四个原子查询的任意组合,用户可根据自己的侧重调整这四个原子查询的权重,以获得个性化的查询结果。其网址是http://www.virage.com。
3 TBIR与CBIR结合检索与科技资源图像
3.1 TBIR、CBIR对比分析
TBIR、CBIR有着各自的优势和不足,对于科技资源这个特定应用背景,TBIR在一定程度上回避了对复杂的可视化元素的识别难题,符合人们熟悉的检索习惯,充分利用了科技资源文本结构信息,实现简单,但是因为仍旧局限在文本检索的范围下,通过受控词汇来描述图像,因此容易出现主题歧义、标引不一、无法对图像内容理解等问题。CBIR恰相反,主要利用对直观形象的特征元素的分析来标引图像,具有一定的客观性,如每幅图像的色彩直方图是确定的,但是CBIR算法复杂,实现成本高。因而TBIR与CBIR结合运用才能促进简单、高效检索科技资源图像的实现。
3.2 TBIR与CBIR结合检索科技资源图像
一个有效的科技资源图像检索系统应该能够模拟选取主观多样性,要便于根据不同用户的标准进行调整。这就要求将文字描述和图像低层属性进行合理利用 [5] 。为此有机整合TBIR和CBIR,构建一个科技资源图像检索系统,使二者互为补充,这样的系统就可以同时获取科技资源图像的低层和高层特征。使用户可以根据需求通过关键词开始检索一个查询,而返回结果后再选择可以作为查询样图的图像进行基于内容属性的检索。科技资源图像检索模型如图1所示。
图1 科技资源图像检索模型
本检索模型,从功能上划分主要可以分为图像管理模块、图像处理模块和图像查询模块。图像管理模块:主要包含图像库的管理,图像的管理极其相关算法管理。图像库管理首先将科技资源中的每幅图像进行图像元数据和文本描述信息的生成,形成图像库;图像管理是对单张图像进行归档;算法管理则是对图像格式、文件格式极其相关数据进行处理。图像处理模块:是本检索模型的关键模块。它主要完成对图像的分析处理功能,即按照相应算法提取图像的特征,建立图像的特征库。同样对待查图像也提取相应的图像特征。图像查询模块:是本检索模型完成图像查询功能模块。将待查图像的特征提取和图像特征库中的特征进行模式匹配,提供查询结果。查询模块提供若干查询条件,是本检索模型的人机交互部分。
4 结束语
本文结合河北省科技基础条件平台中科技资源图像检索的需求,利用TBIR与CBIR相结合的思想,设计了科技资源图像检索模型,使多种种质资源图像信息能够方便查询检索,屏蔽了科技资源图像庞杂的差异,实现了科技资源图像信息的统一表示、统一访问,在技术上有很大的创新。同时,本文对图像特征提取是建立在图像元数据和文本描述信息生成的基础之上,提高了科技资源的查询性能,使得对图像的检索向标准化建设靠近提供了一个创造性实验,并在试运行中取得较好的效果。
参考文献:
[1]李建生.图像元数据特征提取及其在检索中的应用[J].南京师范大学,2005,6.
[2]王振海, 刘庆虎.基于www的图像搜索引擎[J].福建电脑,2005,2:18-19.
[3]Myron Flickner, Harpreef Sawhney, Query by Image and Video Content: The QBIC System, IEEE Computer,1995,28:23-32.
[4]J R Back, C Fuller.The Virage Image Search Engine: An Open Framework for Image Management. In Proc. SPIE: Storage and Retrieval for Still Image and Video Databases,1996,4:76-87.
[5]周文昭, 夏定元.基于内容的图像检索系统的最新进展[J].计算机工程与应用,2003:112-115.
本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。