数字图书馆索引批量查重系统的设计思想

来源 :金色年华·下半月 | 被引量 : 0次 | 上传用户:hongdou0219
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:数字图书馆索引批量查重系统是在数字图书馆查重工作难以进行的状况下产生,它的设计思想是根据部分关键性字段数据内容著录不规范的现状进行考虑的,最终提出了将不规范的关键性字段数据内容进行分割并设置索引的设计方式。本文具体分析了数字图书馆资源查重工作的现状和数字图书馆现有的信息服务系统,在此基础来探讨了基于索引批量查重系统的设计思想的主要内容和设计方式。
  关键词:数字图书馆 索引批量查重系统 设计思想
  随着时代的发展,数字图书馆在社会建设和发展中的作用日渐突出,数字图书馆的全面建设要求各个单位特别重视资源的查重和比对工作,数字图书馆项目在新增资源的要求下,根据实践工作中出现的具体问题,提出了基于索引批量查重系统的设计思想。
  一、数字图书馆资源的查重工作的现状
  数字图书馆资源的查重相较于传统文献的查重方法并无太大的差别,但数字图书馆在运用计算机自动查重比对的过程中,时常面临着文献资源关键字段的著录不规范致使查重工作无法开展的难题。数字图书馆内的数字资源主要来自于公司直接销售产品的过程,但很多公司在著录上没有按照统一的、标准的文献著录规范方式进行著录工作,再者部分公司的录入人员对文献著录的录入规定和相关要求不太熟悉,在录入工作中,著录的数据内容混杂,更加重了数字图书馆资源的查重对比困难。
  在不规范的录入和混乱数据的影响下,资源查重工作很难适应批量查重的需要,针对这种现状,数字图书馆提出了索引批量查重系统的设计思想,对不规范的数据进行了适当的改造,强调了必要字段索引的重要性。
  二、数字图书馆现有的信息服务系统
  目前数字图书馆在资源查重方面已经建立起了诸多的服务系统,为全面认识数字图书馆索引批量查重系统的优势,我们需要先了解其他服务信息服务系统的运作方式。
  (一)门户服务系统
  在数字资源不断丰富和发展的状态下,信息门户成为时下流行的概念,信息门户技术在数字图书馆的应用也相对普遍起来,最后形成了数字图书馆门户。数字图书馆门户主要是读者用来进行内容存取的信息网,它充分利用Web技术和互联网信息资源的应用系统,为顾客提供了智能化、个性化的资源查重服务系统平台。在这个平台上,用户可以根据自己的需要,更加自由便捷地获取图书馆门户中的数字资源。
  (二)数字参考服务系统
  在数字图书馆建立的数字参考服务也是在网络的基础上建立起来的,将用户、专家、学科知识巧妙联系起来的问答式服务。它通过电子手段进行参考服务,并运用不同步和同步两种不同的软件方式进行实时的电子参考服务。用户有什么疑问都可以在网络上提出来,专家再根据这些问题提供在线服务,进行一种人机协调的问答式服务。这是一种灵活的、个性化的信息服务方式,它参考了多种信息资源,在整个数字化空间实现资源共享和集成的服务,有助于数字图书馆的信息服务更快地发展下去。
  (三)个性化信息服务系统
  数字图书馆的个性化信息服务系统是基于用户的信息需求,巧妙利用现代化的信息技术和数字化信息资源向用户提供的能满足用户个性化需求的信息和服务。它主要包括服务内容的个性化和服务方式的个性化。在目前的发展过程中,个性化信息服务囊括了个性化信息定制服务、个性化信息代理服务、垂直门户服务、个性化知识挖掘服务和我的图书馆等服务项目,并紧密结合这些服务方式,为用户创建起基于数字图书馆的所有个性化资源与服务集合,以满足用户对专业资源的信息需求。
  三、索引批量查重系统设计思想的主要内容
  索引批量查重系统设计思想是一个抽象的概念,要了解它的主要内容,我们可以通过图书的具体查阅方式来了解。
  在数字图书馆的资源图书中,图书的题名字段时常混杂着卷册号、版本号、副题名、卷册名、丛书名等多种内容,这些内容在没有完全统一的规定下,内容之间的各种分隔符号使用混乱,顺序的使用上也没有严格的要求。索引批量查重系统设计思想在图书的排名顺序上有着两种明确的方式方法。首先是ISBN+正题名的设计方式,其次是正题名+责任者+出版者+出版年的排序方法。
  在实际著录中正题名和责任者之间的安排顺序是最常出现问题的字段。正题名字段的各种信息产生混杂时,两种信息之间一般都会使用符号进行分隔,在数字图书馆的书目信息数据库里便可以新增简洁明了的题名索引表,将含有分隔符号的各个部分通过程序的引导进行分割,形成题名的关键索引字段,并记录相应的文献内容,在查重对比工作进行前实施预处理工作。
  在查重工作进行时,便可以直接利用索引进行查询,而不是传统的利用源书目数据库这种复杂的查询方式,索引查重结束后还可以利用记录号,还原书目信息,以便于人工浏览和确认的过程能够顺利进行。比如说ISBN图书在查重时就可以使用ISBN+正题名的方式完成比对,非ISBN图书就采用题名+责任者+出版者+出版年的方法进行查重比对。在完成索引后的数据记录工作后,还可以对数据进行必要的过滤和规范工作,完善数据的记录和查重前的预处理手段。
  四、索引批量查重系统设计的方式
  (一)索引表设计
  源书目信息可分为本单位已有资源信息表和数字资源公司提供的销售书目数据库也就是拟采购的资源表两个不同的表格,在设计过程中需要详细注明ISBN、题名、责任者、出版者、出版年这些著录关键信息,并在索引表内根据记录号字段分为题名索引表和责任者索引表两种表格。在题名索引表中落实好记录号、题名、ISBN字段三种信息;在责任者索引表中完善记录号、责任者、出版者、出版年等相关元素。
  (二)查重系统设计
  索引批量查重系统主要分为三个模块,也就是索引建立和预处理模块、批量查重比对模块和查重结果信息还原及输出模块。在这些模块中,需要建立起适合的数据库和临时表格,用于存放查重的结果,并详细划分题名索引和责任索引,使系统能够更好地运行。
  结束语:
  数字图书馆索引批量查重系统的设计思想是一种先进的图书查重思想,它通过题名索引和责任索引的引导和题名字段的设置,规范了查重过程的数据指导,建立起了标准的必要的字段索引思想,并在索引批量查重系统的设计中巧妙运用起来,为查重工作建立起了预处理方案,从而方便了用户对于数字图书馆的专业化查重工作。
  参考文献:
  [1] 毕志蓉.数字图书馆基于索引批量查重系统的设计思想[J].现代情报,2008,28(3):110,113.
  [2] 高隽娴.数学图书馆信息服务体系研究[J].兰台世界,2009,(12):79-80.
  [3] 郑建明,钱鹏.国内数字图书馆建设模式研究——以国家数字图书馆与中国高等教育数字图书馆为例[J].大学图书馆学报,2011,29(1):41-46.
其他文献
风电机组是风电场的主要组成,包括塔筒、机舱、叶片等.文章主要针对塔基、机舱、轮毂等日常故障处理,及风电机组日常维护等方面阐述如何对风电机组进行经济、有效、可靠的处
在工业中,甲苯的应用极为广泛,本次就甲苯硝化制取对其反应工艺的情况进行阐述,由催化剂催化效率、化学组成、物理形态以及可回收性等内容对比各种催化剂,并展望了其绿色化学
期刊
最近,国家旅游局在充分调研的基础上,制订出台《国家旅游局关于规范出境游保证金有关事宜的通知》(以下简称《通知》),首次将出境游保证金纳入旅游行政部门的监管之中。《通
加强对初中学生的读写训练,提高写作能力,这是教学大纲明确规定的“硬件”任务。因此,我们提倡提高读的质量,以读带写,以写促读,读写有机结合。读写本是一家,读是写的基础,写是读的深化。由读过镀到写,由写促进读,读读,写写;写写,读读,彼此循环,相互转化,这是一个由易而难,由低级而高级的渐进过程。因此,初中语文教师应当处理好读写转换关系,建立一套良性的读写渐进循环体系。  目前初中学生的读写能力普遍偏低
期刊
电力系统自动化技术是一个全新的技术领域,对传统技术进行改造,对现代技术进行有效利用,有助于电力系统总体技术的推进.目前,电力系统的自动化技术发展到了一个高阶段,但还是
地形测绘是我国现代地理勘探的重要分支,是掌握地形的最基础技术,数字化技术是现代信息技术和电子技术发展的结果,数字化技术在地形测绘应用大幅的提高工作效率和精度,降低了
中国海关要以“打造先进的、在国际上最具竞争力的海关监管机制”为愿景目标,按照“方法科学、手段先进、密切协同、管理高效”的要求,统筹监管力量、整合监管资源、拓展监管
张继的七绝《枫桥夜泊》,是一首举世公认的抒发羁旅愁怀的千古绝唱,然而,对于诗中“江枫”一词的理解,迄今仍无定谳。或云“江边枫树”(王启兴等:《唐诗三百首评注》,湖北人
摘 要 FDI的区位选择仍然是一个年轻而且正在扩展的领域。这篇文章通过文献综述的形式试图解释其根源、定义其特征并列出其主要的研究变量。首先,文章阐述了传统的FDI区位选择理论,并以此为基础,探讨了在以往的FDI区位选择理论的探讨过程中主要的影响因素,如,经济因素,政治因素,制度因素等。此外,文章还探讨了以往FDI区位选择的今后发展趋势,并在文章最后阐述了该领域目前的研究缺口。  关键词 FDI区位