科技资源图像检索的探讨

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:f805616873
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:科技资源具有海量、复杂、异构、地理分布广的特点,为了高效查找和使用科技资源的图像,指出综合运用TBIR(基于文本的图像检索)和CBIR(基于内容的图像检索)共同检索科技资源图像,并列举了较为先进的图像检索系统,探讨了科技资源图像检索模型。
  关键词:科技资源;图像检索;TBIR;CBIR
  中图分类号:TP302文献标识码:A文章编号:1009-3044(2007)06-11725-02
  
  1 引言
  2005年,河北省科技厅启动了“河北省科技基础平台”(以下简称“科技平台”)项目,其目的是实现我省科技资源的有效整合、共享和服务。《科技资源数据库建设》(以下简称“科技资源”)是科技平台建设课题之一,是融合了河北省的气候资源、农业资源、水文资源、微生物资源、地理资源和动植物资源等科技资源为一体的大型数据库系统。现阶段我们已经进行了气候资源、农业资源、地理资源和动植物资源信息的收集、规范。
  现以野生植物资源为例,目前已有3000多种野生高等植物,2000多幅约700来种各类野生植物的图片,并且图像的尺寸和格式等均有不同,为了使科技资源数据库中庞杂的图像所包含的信息被有效的访问和利用,必然需要一种能够快速而且准确的查找访问图像的技术,即图像的检索技术。
  
  2 图像检索技术的发展
  图像检索技术的发展大体上经过了两个阶段:自20世纪70年代始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),利用文本描述图像的特征;90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、形状等进行分析和检索的图像检索技术,即基于内容的图像检索(Content-based Image Retrieval,简称CBIR)。
  2.1 TBIR
  TBIR的基本思想是,用文本作为关键字索引,利用基于文本的数据库管理系统(DBMS)管理图像的文本信息。其沿用了传统文本检索技术,回避图像语义分析,使用文本描述的形式从图像名称、尺寸大小、压缩类型、主题内容等方面标引图像,一般以分类目录浏览或者是关键词提问的形式检索。
  对于科技资源的图像而言,图像的物理特征信息可以通过资源提供单位提供的信息自动识别,如图像的名称、格式类型、尺寸大小等。目前一些TBIR系统原型已发布到Internet上,因此可以参考这些成熟技术的算法并针对科技资源的特点来实现TBIR,以下是应用该技术的几种典型的图像搜索引擎 [2] 。
  (1)Yahoo! Picture-Gallery:雅虎图像馆目前有40余万幅图像。这些图像按动物、艺术、文化娱乐、自然、科技、体育运动和旅游等进行分类组织,供用户浏览、挑选。用户还可以在检索框输入关键词进行图像检索。网址http://gallery.yahoo.com/;
  (2)Ditto:Ditto是一个纯粹的图像搜索引擎。它的图像索引(Picture Index)库与日俱增。其来源:一是图像拥有者以页面URL地址提供,二是靠它的搜索软件搜索Web空间的图像。其网址是http://www.ditto.com/。
  2.2 CBIR
  CBIR的基本思想是,根据图像的一些低级视觉特征,如颜色、纹理、图像对象的形状以及它们之间的空间关系等内容特征作为图像的索引,计算基准查询图像和图像数据库中图像的相似距离,按照相似度匹配进行检索。目前,有关CBIR技术研究已经取得了很大的突破,比较有代表性的图像检索系统如下:
  (1)QBIC:QBIC[3]是IBM公司在90年代开发的图像和动态影像检索系统,支持基于Web的图像检索服务。系统中以图像、视频及其对象的颜色、纹理、形状、运动等为查询的关键特征,还提供图形化的查询语言,查询的提出通过绘画、选择和其它图形化的途径来完成。其网址是http://www.qbic.almaden.ibm.com/;
  (2)Virage :Virage[4]是由Virage公司开发的基于内容的图像搜索引擎。它支持颜色、颜色布局、纹理和形状四个原子查询的任意组合,用户可根据自己的侧重调整这四个原子查询的权重,以获得个性化的查询结果。其网址是http://www.virage.com。
  
  3 TBIR与CBIR结合检索与科技资源图像
  3.1 TBIR、CBIR对比分析
  TBIR、CBIR有着各自的优势和不足,对于科技资源这个特定应用背景,TBIR在一定程度上回避了对复杂的可视化元素的识别难题,符合人们熟悉的检索习惯,充分利用了科技资源文本结构信息,实现简单,但是因为仍旧局限在文本检索的范围下,通过受控词汇来描述图像,因此容易出现主题歧义、标引不一、无法对图像内容理解等问题。CBIR恰相反,主要利用对直观形象的特征元素的分析来标引图像,具有一定的客观性,如每幅图像的色彩直方图是确定的,但是CBIR算法复杂,实现成本高。因而TBIR与CBIR结合运用才能促进简单、高效检索科技资源图像的实现。
  3.2 TBIR与CBIR结合检索科技资源图像
  一个有效的科技资源图像检索系统应该能够模拟选取主观多样性,要便于根据不同用户的标准进行调整。这就要求将文字描述和图像低层属性进行合理利用 [5] 。为此有机整合TBIR和CBIR,构建一个科技资源图像检索系统,使二者互为补充,这样的系统就可以同时获取科技资源图像的低层和高层特征。使用户可以根据需求通过关键词开始检索一个查询,而返回结果后再选择可以作为查询样图的图像进行基于内容属性的检索。科技资源图像检索模型如图1所示。
  图1 科技资源图像检索模型
  本检索模型,从功能上划分主要可以分为图像管理模块、图像处理模块和图像查询模块。图像管理模块:主要包含图像库的管理,图像的管理极其相关算法管理。图像库管理首先将科技资源中的每幅图像进行图像元数据和文本描述信息的生成,形成图像库;图像管理是对单张图像进行归档;算法管理则是对图像格式、文件格式极其相关数据进行处理。图像处理模块:是本检索模型的关键模块。它主要完成对图像的分析处理功能,即按照相应算法提取图像的特征,建立图像的特征库。同样对待查图像也提取相应的图像特征。图像查询模块:是本检索模型完成图像查询功能模块。将待查图像的特征提取和图像特征库中的特征进行模式匹配,提供查询结果。查询模块提供若干查询条件,是本检索模型的人机交互部分。
  
  4 结束语
  本文结合河北省科技基础条件平台中科技资源图像检索的需求,利用TBIR与CBIR相结合的思想,设计了科技资源图像检索模型,使多种种质资源图像信息能够方便查询检索,屏蔽了科技资源图像庞杂的差异,实现了科技资源图像信息的统一表示、统一访问,在技术上有很大的创新。同时,本文对图像特征提取是建立在图像元数据和文本描述信息生成的基础之上,提高了科技资源的查询性能,使得对图像的检索向标准化建设靠近提供了一个创造性实验,并在试运行中取得较好的效果。
  参考文献:
  [1]李建生.图像元数据特征提取及其在检索中的应用[J].南京师范大学,2005,6.
  [2]王振海, 刘庆虎.基于www的图像搜索引擎[J].福建电脑,2005,2:18-19.
  [3]Myron Flickner, Harpreef Sawhney, Query by Image and Video Content: The QBIC System, IEEE Computer,1995,28:23-32.
  [4]J R Back, C Fuller.The Virage Image Search Engine: An Open Framework for Image Management. In Proc. SPIE: Storage and Retrieval for Still Image and Video Databases,1996,4:76-87.
  [5]周文昭, 夏定元.基于内容的图像检索系统的最新进展[J].计算机工程与应用,2003:112-115.
  本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。
其他文献
运用ANSYS Workbench集成开发平台对自行车车架进行了静力学和动力学及屈曲分析,用以指导车架的形状优化设计.首先,对自行车车架在AWE环境下Design Modeler模块中进行了三维
倒向随机微分方程作为一种新兴的金融工具,尽管理论研究历史较短,但进展却非常迅速,除了其理论本身所具有的有趣的数学性质之外,还具有重要的应用前景,比如金融市场的许多重要的派
摘要:本文对多媒体电脑的日常使用和维护进行了研讨。分别从硬件和软件两个角度出发,将笔者自己多年的经验和他人的观点进行结合,从根源上将多媒体电脑的日常使用和维护进行了详尽的论述。  关键词:硬件;软件;多媒体电脑;使用与维护;故障排除  中图分类号:TP37文献标识码:A文章编号:1009-3044(2007)06-11717-02  到现在,时间已经进入了21世纪的第七个年头了。这时候,多媒体电脑
摘要:在《气象学》教学中合理运用多媒体技术,可以收到良好的效果。文中介绍了使用Power Point,Swishmax,VideoStudio等多种媒体编辑软件制作图片、动画和视频的方法,使用精心编辑后的多媒体素材能更好地配合教学的需要。  关键词:多媒体技术;气象学;教学;应用  中图分类号:G434文献标识码:A文章编号:1009-3044(2007)06-101715-02    1 引言 
随着经济全球化和金融网络化的不断发展,资本开始在全球范围内配置,寻求获利的机会。新兴市场国家由于发展潜力突出,存在众多获利机会,备受国际资本的青睐。不可置否,国际资本确实
本文通过具体实例量化比较研究,得出在Visual Basic环境下快速数据库图像存取的方法,对于其他多媒体信息存取与编程环境也有一定的借鉴作用.
区域经济一体化是现代国际经济的发展趋势,东亚地区国家的区域合作一体化有助于提升区域的竞争力与整体发展。而台湾海峡两岸的经济一体化更是东亚区域经济一体化进程中重要
在现实生活中,无论对于政策制定者还是市场从业人员,进行预测是一件具有现实意义的工作。在宏观经济学领域的学术研究中,对宏观经济变量实施预测往往会遇到模型中自变量选取的问