浅谈国内图书馆集成检索建设

来源 :青年科学·教师版 | 被引量 : 0次 | 上传用户:pang316860297
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:通过对具有代表性的几个图书馆网站集成检索系统的功能和工作原理进行调查分析,总结了目前跨库检索系统呈现出的一些特点,分析存在的问题,并对集成检索的发展提出建议。
  关键词:信息检索 集成检索 跨库检索 现状分析
  引言
  随着计算机存储技术和网络技术的发展,通过网络来提供数据库的查询检索成为图书馆重要的服务方式,图书馆购买和自建数据库数量和种类也日益增多。图书馆因电子信息资源便于传递和共享的特性普遍重视数据库的建设开发和利用。然而各数据库在数据结构、检索机制、检索操作以及图书馆系统软硬件支持条件等方面存在差异,在资源范围方面交叉重复, 使得用户检索负担过重。如何从用户角度一站式的检索多个不同类型的数据库资源,成为图书馆面临的主要问题之一,跨库检索系统就是为解。
  1问题定义
  跨数据库检索是数字图书馆的重要组成部分,它主要实现分布异构数据库的检索。跨数据库检索也称集成检索,联邦检索,分布式检索等。是以多个分布式异构数据源为对象的检索系统。这种系统向用户提供统一的检索接口,将用户的检索要求转化为不同数据源的检索表达式,并发地检索本地的和广域网上的多个分布式异构数据源,实现对不同数据库、不同数据源的查询,并对检索结果加以整合,在经过去重和排序等操作后,以统一的格式将结果呈现给用户。避免用户在各类检索工具之间进行切换,系统全面、准确、快捷地实现对众多数据库的同时查询,并且可以对检索到的资源进行有效的管理(集成管理)。
  提供统一的检索接口,能够减轻用户学习检索不同数据源的负担;并发检索,能节省用户总的检索时间;结果整合,呈现给用户的最终结果格式统一,方便用户的浏览和选择。
  2国内图书馆集成检索现状
  图书馆建设中都将跨库检索作为一项重要的内容加以考虑,国内很多大中型图书馆都自建或购买了跨库检索系统但大多数系统还处在不断的调试和完善当中,国内跨库检索系统的建设,起步较晚,尚需要根据用户群的需求特征,借鉴其他系统的成功之处,不断完善。
  通过对具有代表意义的图书馆集成检索系统在实现方式,功能特性,检索效率,特点等方面进行分析。发现系统的功能,特征不一而足,说明在这一领域的研发工作还处于探索阶段,仍有许多问题值得探讨。
  2.1数字图书馆集成检索平台
  2.1.1清华同方的USP检索平台跨库检索系统
  "清华同方分布异构跨平台跨库智能检索系统"(USP Union Search Platform)平台通过Web访问的方式将其它网络数据库集成到总库平台,是网络数据库接入的一种(此外还有ODBC、OAI、Z29.50、OPENURL接入等)可以方便地管理本单位数字资源。通过统一用户界面帮助用户在多个网络数据库搜索平台中实现信息检索操作,是对分布于网络中的多种检索工具的智能化整合。
  2.1.2中国知网(CNKI)跨库检索系统
  该系统整合了中外文40多个数据库及超星和书生两种电子书,是全面支持知识信息资源建设、共享、增值应用、增值服务、运营管理以及网络出版的数字图书馆系统软件平台。是各大图书馆、情报所、教育城域网中心以及各大单位信息中心建立具备全球知识资源共享、个性化知识服务及网络出版功能的数字图书馆、学习中心必不可少的基础平台
  2.2公共图书馆网站集成检索
  国家图书馆的集成检索,采用同一个检索入口,是与各个资源检索相连接的,检索前需要预先选定资源的类型,每次只能选中一种,从集成检索的效果来看,并未整合各类型的资源,返回结果也不统一。
  虽然设置了统一检索入口,降低了用户使用不同数据和检索方式在检索语言和条件方面的难度,但是在多数据库资源检索和多种类型资源检索方面并没有太多优势。
  2.3大学图书馆网站集成检索系统
  最具代表性的是清华大学图书馆跨库检索系统,依靠易搜平台进行资源的整合。同方易搜是CNKI采用先进的异构资源整合技术,是面向图书馆整合资源与服务的应用平台,是图书馆提供知识服务的新一代门户。具有统一导航、统一认证、统一检索、统一浏览、链接整合、统一维护、使用统计、资源建设、开放平台等功能。支持本地元数据仓储和分布异构资源两种资源整合技术路线,能整合90%以上常见资源,包括WEB资源、OPAC资源、Z3950资源、数据库资源、开放存取资源、纸质资源等。
  其他高校图书馆网站集成检索系统平台建设的现状不一而足,有的已经推出了比较优秀的集成检索平台,有的还处于初级以及在建阶段,很多还是停留在传统的馆内书目查询,单个数据库的资源检索,没有进行整合和统一,在读者查询各类资源方面没有提供高效的方式。
  3我国集成检索系统的主要问题及建议
  3.1建立数据库源的统一规则和标准
  目前我国集成检索数据库源的类型不同,建设的标准不统一,多数的搜索引擎都不能很好地实现对数据库的检索,多数数据库仍需通过特定的数据库接口以特定的方式进行检索。因此,如果没有相对统一的数据库建设标准和接口,那么开发数据库接口、建立索引库、实现不同数据间的格式转换等跨库检索系统的的构建工作将会不停地重复进行,既加重了系统开发的投资,又增加用户利用数据库的成本。
  3.2完善检索功能和其他功能
  跨数据库检索系统的基本功能包括简单检索、高级检索、专业检索、分类检索和期刊导航等。数据库的结构不同,供检索的字段不同,因此,同时检索多个数据库时,应该尽最大可能提供更多的检索点,揭示文献的内容,使检索速度更快,检索结果命中率更准、更全。
  基于知识库管理系统的关键词管理。检索进程显示功能。检索式显示功能。词表辅助检索。检索策略辅助功能。检索结果优化功能。网络化链接检索。结果处理、显示和保存功能。   3.3类型需要多样化
  根据数据库或网站服务的不同用户群体,要进行用户群体分类和用户使用特征偏好的分析总结,建立不同类型的集成检索平台。目前我国图书馆网站服务的群体多数为高校老师学生,科研人员等具备一定知识水平的人员,随着公共图书图书馆的发展和图书馆职能的延伸,服务群体的扩大,不同知识水平的人员对图书馆资源都存在一定的需求,要根据读者种类设计不同类型的集成检索平台。
  3.4用户中心理念
  跨库检索的设计应该突出"以用户为中心"的理念,设计的过程应该在不断的改进,在迭代中使系统的功能得到完善。数据库的选择范围要恰当在实际跨库检索系统构建过程中,应通过市场调研,选择市场占有率较大的数据库进行跨库检索系统的开发,而不应针对所有的数据库进行盲目的跨库检索系统开发。
  3.5注重智能化个性化
  跨库检索系统应紧跟信息检索的发展趋势,注重个性化、智能化服务的提供。个性化主要是指检索内容的特色化和检索个性化的服务。智能化检索是基于自然语言的检索形式,机器根据用户所提供的自然语言表述的检索要求进行分析,而后形成检索策略并进行检索,用户所需要做的只是告诉机器想做什么,至于怎样做则无需人工干预,智能化有待于人工智能(AI)的发展。
  3.6加强国内跨库检索理论与技术的研究
  国外跨库检索的理论与技术相对比较成熟,我们可以借鉴。但是,国外的产品要解决国内数据库的兼容问题,有一定的难度,而且国外产品价格相对较高。因此,要在借鉴国外技术的基础上,加强国内集成检索系统的研究开发。
  参考文献:
  [1]张云秋.国内外跨库检索系统功能的比较研究.图书情报工作,2006(50)
  [2]尹达.跨库检索系统检索效率影响因素辨析.科技情报开发与经济,2007(17)
  [3]李晓莹.图书馆异构数据库检索系统功能分析.情报杂志,2007(2)
  [4]胡 娟.数据库统一检索平台的功能比较.现代情报,2005(4)
  [5]陈定权,刘 胜.印本图书与电子图书的集成检索.图书馆杂志,2008(12)国内外
  [6]王效岳,王志玲.异构数据库统一检索系统的比较研究.情报检索,2005(12)
  [7]李广建,张智雄.国外跨库检索系统研究项目及其特点.在国外,2004(27)
  作者简介:王旭, 1986年生,男,山东烟台人,湘潭大学在读硕士研究生。
其他文献
四川人事考试网是省内负责考友考试信息发布的重要政府网站,其开通的政务微博通过将考试信息和重要通知公布给所有用户,让用户第一时间知道最新的考试信息.本文试图简要分析
摘 要:本文在对整流滤波电路和逆变电路的分析中,选取了多种电路进行分析,通过参数对比、性能对比,以及根据小功率UPS应用中的实际要求,从中选择出较为合适的电路,例如在对整流滤波电路的选择中,详细对比了单相桥式整流滤波电路和单相全波整流滤波电路,并给出了选择单相桥式整流滤波电路的原因。  关键词:UPS;结构设计;供电系统  UPS电源已从上世纪60年代的旋转发电机发展至今天的具有智能化程度的静止式
摘 要:HDB3码是数字基带通信系统中重要组成部分之一,因其具有无直流成份、检错能力强、具有时钟恢复性能等优点,故成为了ITU推荐使用的基带传输码型之一。在概述HDB3码及其编码规则的基础上,基于CPLD研究了HDB3编码器的建模与设计,以期为HDB3编码器的研究提供有益的参考。  关键词:数字基带通信;HDB3;CPLD;VHDL  随着现代计算机技术和微电子技术的快速发展,电子产品的开发速度随
摘 要:温度是在生产与生活中都常涉及到的表征物体的冷热程度的物理量,故温度控制在各生产领域中都会受到重视。以STC89C52单片机为主控制单元,以DS18B20为温度传感器,从硬件电路和系统程序这两个方面设计了一种温度控制系统。结果表明:该系统可以实时存储及显示相关温度数据,并能调控相关温度。  关键词:单片机;温度控制;STC89C52;DS18B20  由于系统受其他热源的干扰,系统在实际生产
基金项目:天津市高等学校人文社会科学研究项目--高校大学生网络思想政治教育工作长效性和实效性研究  摘 要:新媒体为高校网络思想政治教育带来了机遇和挑战,新的媒体形式也使网络思想政治教育传播更加迅速。主动构建高校网络思想政治教育的载体和创新教育内容,可有效增强高校网络思想政治教育的实效性。  关键字:新媒体、网络思想政治教育  新媒体是新的技术支撑体系下出现的媒体形态,如数字杂志、数字报纸、数字广
摘 要:目前,我国许多中小企业采用人工混料的方式来进行配料,故不能达到现代企业对混料过程精确、快速、实时的质量控制需求。根据中小企业的经济现状和混料质量控制需求,以单片机为控制核心设计了自动混料控制系统。该系统结构简单,控制方便,具备混料数据采集、数据存储显示、混料自动控制等功能,并在控制回路采用积分分离PlD算法,有效地改善了系统控制性能。该系统还具有一定通用性,能对其稍作改进后便能适用于众多企
摘 要:网络购物是利用现代信息技术和互联网技术,将传统购物带入信息化和远程化的一种现代商业运作方式。这种方式转变的传统的商业形态,实现了消费者足不出户就能选购自己所喜爱商品的愿望,并在今年成为一种主流的商业形式。但是这种商业模式在给消费者带来极大方便的同时,也因其自身的特殊性,给消费者的权益保护带来了诸多意想不到的新问题。这些问题的产生自有其原因,而要解决问题就要对症下药,找出有效的方法措施,从而
摘 要:印度矿产资源比较丰富,为更好促进矿产资源的开发,吸引更多的外资进入印度矿业市场,印度政府加大了改善矿业投资环境的力度。从印度矿产资源权属问题、印度矿产资源管理制度、印度矿业投资的外资准入、印度矿业法规及其修订等方面研究印度矿业投资法律环境,有利于企业更有效地投资印度矿业。  关键词:矿产权属;矿产资源管理;外资准入;法规及修订  印度矿产资源比较丰富,主要矿产有铁矿石、锰、铝土矿、铬、铜、
摘 要:面向服务架构SOA是当前解决异构系统整合和应用系统集成问题的理想方案。通过使用SOA中的服务数据对象及数据访问服务技术,对异构服务数据模型进行设计,该模型屏蔽了异构数据库间的数据访问细节,从而隔离了数据源与应用层,实现业务逻辑与数据源的松耦合。  关键词:SOA; 服务数据对象; 异构数据模型  0引言  随着计算机技术发展和应用的日益广泛,企业积累了大量以不同形式存储的电子数据,这些数据
摘 要:促进区域经济协调发展是全面深入贯彻落实科学发展观的必然要求,是推动构建社会和谐、全面建设小康社会的重要支撑。滨海新区作为中国北方环渤海地区新的经济引擎、京津冀发展最具活力的地区和天津最大的经济增长点,统筹区域发展、建立推进区域经济协调发展的新机制,对于促进滨海新区经济社会全面、协调、稳定和健康发展,努力建设世界加工制造基地和国际现代物流中心,将会起到极其重要的作用。本文浅析了滨海新区区域协