论文部分内容阅读
摘 要:数字技术的飞速发展,学术期刊也随之向数字化、尤其是网络化发展。本文以中国知网(CNKI)为例,从其检索功能、内容扩增功能和个性化服务功能等三个方面进行分析,使用户能充分了解资源型数据库的特点及不足,以便更高效、准确的使其为我们服务。
关键词:全文数据库;数字化;检索;CNKI
中图分类号:G252.7 文献标识码:A 文章编号:1672-8122(2013)06-0103-02
随着信息化程度不断提高,今天的社会进入了一个崭新的数字化传播时代。数字化的信息充斥在我们周围,成为当今世界中不可缺少的一种国际性语言。近年来,我国数字化的快速发展,也带动了学术期刊的数字化传播,因此而衍生出的数据库也即成为今天无论是高校图书馆还是各科研单位进行资源共享不可或缺的工具之一,对数据库随着数字化传播时代的到来而不断改进的功能研究也就越发显得必不可少。数据库功能的发展可以回溯到20世纪60年代,至今已经过半个多世纪的发展,在数量和质量方面都有了显著的变化,许多功能强大的高质量数据库层出不穷的涌现出来。中国知网(CNKI)就是其中之一,它以其海量数据的高度整合,集题录、文摘、全文文献信息于一体,实现一站式文献信息检索等特点而成为目前国内可进行全方位学科专业引文检索的综合性数据库之一,也是使用群体最广的资源型数据库。
谈到CNKI可以说是无人不知,无人不晓,那么它的具体含义是什么呢?中国知网即国家知识基础设施(National Knowledge Infrastructure,CNKI)的概念,由世界银行提出于1998年。CNKI工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起,始建于1999年6月。经过多年努力,采用自主开发并具有国际领先水平的数字图书馆技术,建成了世界上全文信息量规模最大的“CNKI数字图书馆”,并正式启动建设《中国知识资源总库》及CNKI网格资源共享平台,通过产业化运作,为全社会知识资源高效共享提供最丰富的知识信息资源和最有效的知识传播与数字化学习平台[1]。面对这样一个庞大冗杂的数据库 ,它的哪些功能是能为我们所用呢?除了一般的全文数据库所具有的功能,还有哪些特色功能是不为我们所熟知呢?带着这些疑问,笔者结合实际工作情况,对CNKI的部分功能使用做了一次较详细的研究。
一、引文检索功能的全方位使用
对于任何一位使用数据库的用户来说,引文检索功能是为大众最熟悉最擅长使用的。无论是先期开发的文摘索引库还是目前发展比较快的全文数据库,用户对引文检索功能的研究较久,因此构成引文检索功能的软件技术也相对稳定与成熟。
CNKI数据库包括全文检索在内的众多引文检索入口,用户可以通过某个检索入口进行初级检索,为了更快捷更准确的查找到所需文章,我们可以进行高级检索,即时间段选择、文献来源类别选择以及文献精确度选择等多个细分项目来进行检索。从浅层次看,CNKI提供的引文检索功能似乎只能检索被引作者的论文被引用情况,实则其引文检索功能非常强大。鉴于CNKI能对每个字段分别进行全文检索,故对引文字段中的所有著录项目也能分别检索,包括参考文献的作者、题名、刊名及出版年代等。通过输入不同的检索项目,几乎可以完成所有的引文检索需求。CNKI已经实现全文检索信息完全的数字化,通过免费下载的最先进的浏览器,可实现期刊论文原始版面结构与样式不失真的显示与打印。
日臻完善的引文检索功能以及检索信息数字化的全面实现,为越来越多的编辑从业人员提供了工作上的便利。就拿笔者所从事工作来看,对CNKI引文检索功能所带来的益处深有体会。笔者工作以做人物专题信息为主,其中人物学术文献资源的整合是工作重点,因此,在日常工作中会经常使用CNKI引文检索功能,不仅能全面检索到专题人物的文献著作,而且还能进行时间段筛选,选择我所需要的年份文献,再通过CAJViewer浏览器直接转换为TXT文本,大大缩短了编辑时间,提高了工作效率。
二、内容扩增功能的全面认识
近年来,数据库的发展可谓是规模化进行,数据库运营商一方面加紧原数据的连续性和回溯性建设,同时还整合一些免费资源,并不断购买其他相关数据资源,作为其原有内容的补充;另一方面积极研发跨库检索平台,使各种类型的单一型数据库整合成一个相对完整的资源系统,把一定范围内最全面的文献信息提供给用户,从而实现较大范围的内容增值。随着各学科的深入发展,跨学科与交叉性文献越来越多,数据库作为文献资源的动态集合体,必须打破原有的文献收录范围限制,扩增其收录范围,网络技术为数据库的内容扩增提供了优越的条件[2]。
中國知网(CNKI)具有统一的跨库检索平台,可以针对《中国期刊全文数据库》、《中国优秀博硕士学位论文全文数据库》、《中国重要会议论文全文数据库》、《中国重要报纸全文数据库》等数据库进行同时检索。用户在使用CNKI的过程中,通过多角度一次性可以获得某主题内容的期刊文献、学位论文、会议资料、图书等不同类型的文献资源,从而实现检索内容的增值。这种一站式服务,减少了在多个界面之间反复切换的步骤,使得用户能在最短的时间内获得最全的资源,这一功能,是其他资源型数据库所无法企及的。
三、个性化服务功能亟待被充分认识
随着数字图书馆的广泛建立,单一的图书馆模式已经不能满足日趋庞大的使用人群,个人数字图书馆的概念逐渐被用户所熟知。CNKI正是顺应这一时代要求,同时基于自身多样化的产品形式,及时的数据更新,以及可满足不同类型、不同行业、不同规模用户个性化的信息需求这一特点,推出个人数字图书馆与机构数字图书馆这两个全新模块。由于用户对于个性化图书馆的概念还不是很清晰,因此使用这两大板块功能的用户相对较少,该项个性化服务功能亟待被充分认识。CNKI个人数字图书馆为用户提供的个性化服务功能包括:自动跟踪读者所研究主题的最新发文;为读者提供管理评价本人成果的平台;连通机构馆后免费下载文献;打造属于自己的个性化阅览室。任何登录CNKI的个人用户,都可以根据个人工作性质、工作领域创建符合自身特点的研究型个人馆、中小学读者个人馆或者生活型个人馆。引用中国知网的一句话就是:“个人馆是您学习、研究、创新的情报员、智囊团和图书馆”。 对于企事业单位来讲,个性化特色图书馆的打造在今天这样一个传播互动广泛化的时代,显得更加迫在眉睫,遗憾的是,大多数机构还没有认识到这样的发展模式。CNKI机构数字图书馆的为机构能提供哪些功能呢?可以为机构提供文献资源一站式整合平台;构建层级化的机构管理体系;提供详尽、准确的资源使用情况统计;为机构定制个性化信息门户。根据行业类型,已经细分出高校、科研单位、公共图书馆、医院、职业教育、法律、企业、基础教育、军队等九个类型的机构图书馆。同样引用中国知网的一句话概括“机构馆是您单位创新发展的情报员、智囊团和图书馆”。
对于从事编辑工作的人员而言,能够充分认识并能熟练使用个人数字图书馆提供的各项特色服务功能,将会在工作中起到事半功倍的作用。任何事物都存在着双面性,我们在体会CNKI带来的巨大便利的同时,也感受到其存在的一些不足之处,主要表现在以下几个方面:
1.在引文检索方面的不足。一是不能同时检索某个机构所有科研人员的论文被引情况,只能先分别检索该机构单个个体论文的被引情况,最后汇总才能得到整个机构的论文被引情况。二是检索结果的整理比较烦琐,不能直接输出规范的引文检索结果。
2.收录信息不完全。由于我国数据库所收录文献开始时间较早,因此数据库在回溯检索功能方面有待于进一步加强,而且有些重要期刊存在着漏收现象,核心期刊收录率低,大大降低了检索结果的参考价值。做为数据库的两大基本要求即数据收录的连续性和完整性,缺收、漏收都会降低数据库质量,影响数据库的检索效果。
3.数据项目著录内容不全。有些数据缺少机构、摘要,甚至某些论文的著录项目中缺少关键词和作者项。著录项目不全同样会影响到数据库的质量,给用户进一步的检索带来了很大的不便。
4.数据略显滞后。由于时间更新问题,虽然中心数据库可能做到每日更新资料,但具体到用户使用时,仍需等待一段时间,给用户的检索与查新带来一定的影响。
5.页面自动关闭问题。用户在使用数据库进行检索的过程中,若因故暂停检索或停留在浏览页面几分钟,系统就会提示:“您的操作己超时,请重新登录!”,从而中断检索,如想继续检索还需重新登录。这一不足导致用户在重新登录环节会浪费很多时间。
6.文章下载版本的局限。CNKI通用的文本下载版本为CAJ与PDF,大多数用户没有CAJ软件,然而PDF的下载速度非常之慢,给用户的使用带来局限。
对于以上问题,有哪些比较好的应对策略呢?笔者认为:
1.数据库应能根据检索者的要求,检索出所需的文章。在对某一专题进行检索或查新时,要对数据库的资源有一个总体认识,明确有无缺期和漏刊的情况,尽可能保证检索资料的客观与全面。数据库信息资源的采集人员应尽量保证期刊的完整,进而提高查全率。
2.数据滞后需要编辑部、杂志社与数据库采编人员的共同努力,编辑部可以直接把杂志的电子版加入到数据库,使用户能在第一时间检索到最新的资料。
3.漏检主要与用户检索方法有关。减少漏检的方法有认真选择主题词或关键词和检索项,同时可采用简单检索和高级检索两种方式双管齐下。对于显示“无相关文献”的检索不要轻易放弃,可用文献名、作者、标题等多途径检索。由于目前我国的文献出版工作还存在很多不规范的地方,许多文章没有关键词等项目,或作者标引的关键词不规范,存在大量的同近义词,造成同一主题的文献记录分散。另外标引人员专业知识所限,对于隐性概念未能准确提炼,这些都会降低数据库的查全率,造成漏检。
综上,资源型数据库建设包括技术、管理和知识产权等诸多因素,它的完善不是一朝一夕、单枪匹马就能完成,需要业内人士的共同努力。提高数据库的查全率与查准率不仅是用户的目标,也是评价一个数据库和衡量信息检索系统检索效果的重要指标。虽然存在着以上诸多待完善方面,但瑕不掩瑜,CNKI的引文检索功能、内容扩增功能及个性化服务功能在飞速发展的数字化传播时代为我国学术研究提供了全新的便利工具,必将对学術研究工作产生深远而重大的影响。
参考文献:
[1] 中国知网.数据库信息介绍[OL].www.cnki.net/KNS/brief /result.aspx?dbprefix=CJFQ.
[2] 杜香莉,鲁敏,周东晓.网络文献数据库功能及其应用研究[J].农业图书情报学刊,2008(8).
关键词:全文数据库;数字化;检索;CNKI
中图分类号:G252.7 文献标识码:A 文章编号:1672-8122(2013)06-0103-02
随着信息化程度不断提高,今天的社会进入了一个崭新的数字化传播时代。数字化的信息充斥在我们周围,成为当今世界中不可缺少的一种国际性语言。近年来,我国数字化的快速发展,也带动了学术期刊的数字化传播,因此而衍生出的数据库也即成为今天无论是高校图书馆还是各科研单位进行资源共享不可或缺的工具之一,对数据库随着数字化传播时代的到来而不断改进的功能研究也就越发显得必不可少。数据库功能的发展可以回溯到20世纪60年代,至今已经过半个多世纪的发展,在数量和质量方面都有了显著的变化,许多功能强大的高质量数据库层出不穷的涌现出来。中国知网(CNKI)就是其中之一,它以其海量数据的高度整合,集题录、文摘、全文文献信息于一体,实现一站式文献信息检索等特点而成为目前国内可进行全方位学科专业引文检索的综合性数据库之一,也是使用群体最广的资源型数据库。
谈到CNKI可以说是无人不知,无人不晓,那么它的具体含义是什么呢?中国知网即国家知识基础设施(National Knowledge Infrastructure,CNKI)的概念,由世界银行提出于1998年。CNKI工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起,始建于1999年6月。经过多年努力,采用自主开发并具有国际领先水平的数字图书馆技术,建成了世界上全文信息量规模最大的“CNKI数字图书馆”,并正式启动建设《中国知识资源总库》及CNKI网格资源共享平台,通过产业化运作,为全社会知识资源高效共享提供最丰富的知识信息资源和最有效的知识传播与数字化学习平台[1]。面对这样一个庞大冗杂的数据库 ,它的哪些功能是能为我们所用呢?除了一般的全文数据库所具有的功能,还有哪些特色功能是不为我们所熟知呢?带着这些疑问,笔者结合实际工作情况,对CNKI的部分功能使用做了一次较详细的研究。
一、引文检索功能的全方位使用
对于任何一位使用数据库的用户来说,引文检索功能是为大众最熟悉最擅长使用的。无论是先期开发的文摘索引库还是目前发展比较快的全文数据库,用户对引文检索功能的研究较久,因此构成引文检索功能的软件技术也相对稳定与成熟。
CNKI数据库包括全文检索在内的众多引文检索入口,用户可以通过某个检索入口进行初级检索,为了更快捷更准确的查找到所需文章,我们可以进行高级检索,即时间段选择、文献来源类别选择以及文献精确度选择等多个细分项目来进行检索。从浅层次看,CNKI提供的引文检索功能似乎只能检索被引作者的论文被引用情况,实则其引文检索功能非常强大。鉴于CNKI能对每个字段分别进行全文检索,故对引文字段中的所有著录项目也能分别检索,包括参考文献的作者、题名、刊名及出版年代等。通过输入不同的检索项目,几乎可以完成所有的引文检索需求。CNKI已经实现全文检索信息完全的数字化,通过免费下载的最先进的浏览器,可实现期刊论文原始版面结构与样式不失真的显示与打印。
日臻完善的引文检索功能以及检索信息数字化的全面实现,为越来越多的编辑从业人员提供了工作上的便利。就拿笔者所从事工作来看,对CNKI引文检索功能所带来的益处深有体会。笔者工作以做人物专题信息为主,其中人物学术文献资源的整合是工作重点,因此,在日常工作中会经常使用CNKI引文检索功能,不仅能全面检索到专题人物的文献著作,而且还能进行时间段筛选,选择我所需要的年份文献,再通过CAJViewer浏览器直接转换为TXT文本,大大缩短了编辑时间,提高了工作效率。
二、内容扩增功能的全面认识
近年来,数据库的发展可谓是规模化进行,数据库运营商一方面加紧原数据的连续性和回溯性建设,同时还整合一些免费资源,并不断购买其他相关数据资源,作为其原有内容的补充;另一方面积极研发跨库检索平台,使各种类型的单一型数据库整合成一个相对完整的资源系统,把一定范围内最全面的文献信息提供给用户,从而实现较大范围的内容增值。随着各学科的深入发展,跨学科与交叉性文献越来越多,数据库作为文献资源的动态集合体,必须打破原有的文献收录范围限制,扩增其收录范围,网络技术为数据库的内容扩增提供了优越的条件[2]。
中國知网(CNKI)具有统一的跨库检索平台,可以针对《中国期刊全文数据库》、《中国优秀博硕士学位论文全文数据库》、《中国重要会议论文全文数据库》、《中国重要报纸全文数据库》等数据库进行同时检索。用户在使用CNKI的过程中,通过多角度一次性可以获得某主题内容的期刊文献、学位论文、会议资料、图书等不同类型的文献资源,从而实现检索内容的增值。这种一站式服务,减少了在多个界面之间反复切换的步骤,使得用户能在最短的时间内获得最全的资源,这一功能,是其他资源型数据库所无法企及的。
三、个性化服务功能亟待被充分认识
随着数字图书馆的广泛建立,单一的图书馆模式已经不能满足日趋庞大的使用人群,个人数字图书馆的概念逐渐被用户所熟知。CNKI正是顺应这一时代要求,同时基于自身多样化的产品形式,及时的数据更新,以及可满足不同类型、不同行业、不同规模用户个性化的信息需求这一特点,推出个人数字图书馆与机构数字图书馆这两个全新模块。由于用户对于个性化图书馆的概念还不是很清晰,因此使用这两大板块功能的用户相对较少,该项个性化服务功能亟待被充分认识。CNKI个人数字图书馆为用户提供的个性化服务功能包括:自动跟踪读者所研究主题的最新发文;为读者提供管理评价本人成果的平台;连通机构馆后免费下载文献;打造属于自己的个性化阅览室。任何登录CNKI的个人用户,都可以根据个人工作性质、工作领域创建符合自身特点的研究型个人馆、中小学读者个人馆或者生活型个人馆。引用中国知网的一句话就是:“个人馆是您学习、研究、创新的情报员、智囊团和图书馆”。 对于企事业单位来讲,个性化特色图书馆的打造在今天这样一个传播互动广泛化的时代,显得更加迫在眉睫,遗憾的是,大多数机构还没有认识到这样的发展模式。CNKI机构数字图书馆的为机构能提供哪些功能呢?可以为机构提供文献资源一站式整合平台;构建层级化的机构管理体系;提供详尽、准确的资源使用情况统计;为机构定制个性化信息门户。根据行业类型,已经细分出高校、科研单位、公共图书馆、医院、职业教育、法律、企业、基础教育、军队等九个类型的机构图书馆。同样引用中国知网的一句话概括“机构馆是您单位创新发展的情报员、智囊团和图书馆”。
对于从事编辑工作的人员而言,能够充分认识并能熟练使用个人数字图书馆提供的各项特色服务功能,将会在工作中起到事半功倍的作用。任何事物都存在着双面性,我们在体会CNKI带来的巨大便利的同时,也感受到其存在的一些不足之处,主要表现在以下几个方面:
1.在引文检索方面的不足。一是不能同时检索某个机构所有科研人员的论文被引情况,只能先分别检索该机构单个个体论文的被引情况,最后汇总才能得到整个机构的论文被引情况。二是检索结果的整理比较烦琐,不能直接输出规范的引文检索结果。
2.收录信息不完全。由于我国数据库所收录文献开始时间较早,因此数据库在回溯检索功能方面有待于进一步加强,而且有些重要期刊存在着漏收现象,核心期刊收录率低,大大降低了检索结果的参考价值。做为数据库的两大基本要求即数据收录的连续性和完整性,缺收、漏收都会降低数据库质量,影响数据库的检索效果。
3.数据项目著录内容不全。有些数据缺少机构、摘要,甚至某些论文的著录项目中缺少关键词和作者项。著录项目不全同样会影响到数据库的质量,给用户进一步的检索带来了很大的不便。
4.数据略显滞后。由于时间更新问题,虽然中心数据库可能做到每日更新资料,但具体到用户使用时,仍需等待一段时间,给用户的检索与查新带来一定的影响。
5.页面自动关闭问题。用户在使用数据库进行检索的过程中,若因故暂停检索或停留在浏览页面几分钟,系统就会提示:“您的操作己超时,请重新登录!”,从而中断检索,如想继续检索还需重新登录。这一不足导致用户在重新登录环节会浪费很多时间。
6.文章下载版本的局限。CNKI通用的文本下载版本为CAJ与PDF,大多数用户没有CAJ软件,然而PDF的下载速度非常之慢,给用户的使用带来局限。
对于以上问题,有哪些比较好的应对策略呢?笔者认为:
1.数据库应能根据检索者的要求,检索出所需的文章。在对某一专题进行检索或查新时,要对数据库的资源有一个总体认识,明确有无缺期和漏刊的情况,尽可能保证检索资料的客观与全面。数据库信息资源的采集人员应尽量保证期刊的完整,进而提高查全率。
2.数据滞后需要编辑部、杂志社与数据库采编人员的共同努力,编辑部可以直接把杂志的电子版加入到数据库,使用户能在第一时间检索到最新的资料。
3.漏检主要与用户检索方法有关。减少漏检的方法有认真选择主题词或关键词和检索项,同时可采用简单检索和高级检索两种方式双管齐下。对于显示“无相关文献”的检索不要轻易放弃,可用文献名、作者、标题等多途径检索。由于目前我国的文献出版工作还存在很多不规范的地方,许多文章没有关键词等项目,或作者标引的关键词不规范,存在大量的同近义词,造成同一主题的文献记录分散。另外标引人员专业知识所限,对于隐性概念未能准确提炼,这些都会降低数据库的查全率,造成漏检。
综上,资源型数据库建设包括技术、管理和知识产权等诸多因素,它的完善不是一朝一夕、单枪匹马就能完成,需要业内人士的共同努力。提高数据库的查全率与查准率不仅是用户的目标,也是评价一个数据库和衡量信息检索系统检索效果的重要指标。虽然存在着以上诸多待完善方面,但瑕不掩瑜,CNKI的引文检索功能、内容扩增功能及个性化服务功能在飞速发展的数字化传播时代为我国学术研究提供了全新的便利工具,必将对学術研究工作产生深远而重大的影响。
参考文献:
[1] 中国知网.数据库信息介绍[OL].www.cnki.net/KNS/brief /result.aspx?dbprefix=CJFQ.
[2] 杜香莉,鲁敏,周东晓.网络文献数据库功能及其应用研究[J].农业图书情报学刊,2008(8).