论文部分内容阅读
〔摘要〕从深度利用数据资源和助力科研的角度,对比分析Web of Science和Google Scholar在化学领域中的性能差异。通过对比分析,从检索性能、分析性能、覆盖能力、引文跟踪、定题跟踪等方面进行比较和案例分析。发现Web of Science在化学领域具有权威性、稳定性、功能性等优势,其专业性能尚未充分利用。指出图书馆深入挖掘数据资源实用价值,提出从检索到发现的服务思路,推动技能服务和分析服务的双向服务模式。
〔关键词〕Web of Science;Google Scholar;文献检索;引文分析;学术检索平台分析
DOI:10.3969/j.issn.1008-0821.2016.08.020
〔中图分类号〕G2549〔文献标识码〕A〔文章编号〕1008-0821(2016)08-0103-06
〔Abstract〕From the perspective of depth using the data resources and power of scientific research,analysis of the Web of Science and Google Scholar performance in the field of chemistry.Taking comparison and case analysis,from the retrieval performance,this paper analyzed performance,coverage,citation tracking,topic tracking,etc.Web of Science has the authority,stability,functional advantages,but its performance had yet to make full use of.Library needed to dig deeper into the data resources and practical value,this paper proposed the search to discovery service idea,and promoted two-way service mode on skills and analysis.
〔Key words〕Web of Science;Google Scholar;literature retrieval;citation analysis;academic analysis retrieval platform
数据资源的挖掘与利用对科学研究和学科发展有着至关重要的作用。做好科研工作,必须具备高效的获取、筛选、使用,甚至发现信息的能力,每个科研工作者都需要掌握文献检索和分析技能。就图书馆而言,若想助力科研提升资源服务能力,必须了解科学研究的实际流程和需要,了解主要检索平台和数据库的性能和优缺点,深入挖掘并充分利用数字资源来服务用户。然而,窥探现今商业数据库的利用现况,大部分用户对图书数资源的利用仍然停留在获取下载权限上,图书馆对于科研用户的检索分析、知识发现等方面的支持不够有力,图书馆数字资源服务在助力科研方面仍有待深入。
1研究目的与现状
本次研究以资源利用和服务为导向,根据检索实验结果,评估Web of Science在化学领域的性能,将其与科研人员经常使用的学术搜索引擎Google Scholar相比较。期待通过对比分析和实证分析发现Web of Science在化学领域的价值关键,以此探究提高科研效率和能力的服务途径。
早期研究指出WoS的优势主要在于其权威性和专业的引文分析功能,在后来的研究中GS在准确性、相对查全率、检索能力方面变现有所提高[1]。
国外研究指出在人文科学中WoS作为常用的文献数据资源对于研究者是不利的,相对而言GS在人文领域提供了更好的计算指标和更全面的覆盖面积[2]。在化学领域WoS等三大商业数据库具有明显相似性,而GS与其差异明显,文章获得率不及WoS(GS查到文献1 747篇,WoS查到文献1 837篇),引文数量也有较大差距(GS引文总量9 320,WoS引文总量44 502)[3]。此后有研究指出,在化学和物理领域GS经过一阶段的显著增长后呈现稳定增加状态,这种稳定增加使其比以往更适合进行研究评估和文献计量学研究[4]。在地理领域GS具有更广泛的结果数量,然而却不具备可替代商业数据库的绝对优势,在人文地理领域GS表现更好,而在自然地理领域WoS表现更好,GS相对WoS等商业数据库而言在检索简单的同时,处理检索结果的文献分析功能较弱,不利于快速排查[5]。
国内的相关研究指出WoS胜在权威性和引文功能,而GS文献类型更丰富,但重复性大[6]。从被引频次的角度分析WoS更加系统,GS相对不够稳定[7]。从引文数量、类型、重复率等方面分析,认为WoS更具权威性,但在图书情报领域GS也可以作为引文分析工具[8]。从用户角度出发,考虑检索功能和引文评价指标来看,WoS的引文功能优于GS[9]。然而,从科学研究的需求角度出发,仍然缺少对于WoS性能的系统分析,缺少WoS等商业数据平台的利用剖析,对于其数字资源在不同学科的价值也不够全面。
21文献检索
选取检索词在两个文献检索平台上进行相同的检索操作。选取的检索词必须是化学领域广泛使用的,具有代表性的,并且可以提供足够的检索结果以供数据分析,包括单词、词组、分子式。
严格执行相同的检索条件和检索过程,分别将关键词置于双引号中或不使用双引号(科研人员通常检索习惯),在“标题”字段和“主题”字段(默认字段)进行检索,记录检索结果。 为了获得更多的结果数量满足讨论需要,文献检索期间每周进行两次相同过程的检索。使用Endnote和Excel进行结果处理。
22数量分析
使用Excel对结果数据进行处理,制作图表分析研究数据在数量上的差异、变化或变量之间的依赖关系。
23引文分析——案例分析
确定引文跟踪和定题跟踪的文献题目和检索内容,分别在两个检索工具中定制跟踪服务。从时效性和结果数量上比较引文跟踪和定题跟踪的性能。
使用Excel进行数量分析,人工对跟踪结果进行时效性分析。使用Endnote筛选重复文献。
24重叠与独有
基于一系列化学文献计算检索工具的传统重复性(TO)与相对重复性(RO)。
传统重复性:
TO=A中文献∩B中文献A中文献∪B中文献×100%
相对重复性:
RO(A)=A中文献∩B中文献A中文献×100%
RO(B)=A中文献∩B中文献B中文献×100%
3结果及分析
31检索性能
从检索方式和字段上来看,WoS更加专业,检索模式更加多样,检索字段更为丰富,可提供更为精确的检索组合。特别是WoS具有化学结构检索,这点对于化学领域来说优势相当明显,同时WoS具有地址检索的功能体现出其作为文献检索工具的专业性,引文分析能力更强。
然而,WoS的检索速度不及GS,通常GS可在002~007秒提供检索结果,而WoS却需要1~3秒,这种等待时间令人感到不适。
从筛选的性能上来看,WoS可以进行研究领域、研究方向、文献类型、出版物名称、出版年等15种结果精炼。WoS的精练项目更为细致,更适合进行专业的引文分析。但是WoS语种指令和语种丰富程度不如GS,而且二次检索功能不如GS方便。
从排序性能来看,WoS可根据出版时间、被引频次、相关性等进行15种排序。GS只能根据相关性和日期进行排序。其排序功能不如WoS强大,特别是缺少被引频次排序,仅利用相关性智能显示结果,不能快速找到重点文章。
从原文获取能力上看,WoS不提供原文,提供原文指向链接,是否可获取原文由原文所在数字资源是否被购买而决定,通常在可获得原文的情况在,需要进行2~3次链接。GS自动获取可用全文,直接单击链接即可查看。
从引文分析的角度来看,WoS可以进行检索结果的引文分析,创建引文报告,对相关问题的研究态势进行分析,也可以查看单一文章的被引频次及文章、引用的参考文献、相关文献。GS不能对检索结果进行整体的引文统计和分析,对单一文章可以查看被引频次及文章、相关文章,及其WoS中引用该文献的文章。
32检索结果数量分析
321时间演化及稳定性分析
我们根据8个测试时间WoS与GS的检索记录,观察检索结果与时间的演化关系。图1是每个检索时段检索结果平均数随时间的演化情况。
如图1所示,无论是在主题字段(WoS与GS的默认字段)还是标题字段进行检索,随时间推移,WoS的结果数量均呈现稳定的态势,没有明显波动,核对检索结果数量可见其平稳上升趋势。然而,GS的检索结果随时间推移有明显的浮动显现,图1a中的波动尤为明显,主题检索结果数量起伏较大,极不稳定,图1b标题检索GS表现相对稳定,但第二次检索结果明显减少。图1检索结果时间演化
从时间演化上分析,WoS数据更为稳定,GS虽然结果产量巨大,但具有明显的不稳定性,且已有研究结果指出了GS检索结果的重复性和嘈杂性,因而,我们并不能从其结果数量大说明其更有利于化学科研。
322化学领域数量性能
图2显示了WoS和GS在标题字段进行检索的性能。
图2呈现了8次检索测试中各个检索词检索结果的变化情况,从图中可以看出,WoS中各检索词的结果变化稳定,呈现平缓上升趋势,“graphene”的上升趋势明显。
GS检索结果变化波动较大,几乎每次检索都有浮动,甚至出现多次检索结果急剧减少的情况,“graphene”和“hydrothermal”科研产出持续增多,在GS的2、4、6次检索中却出现了明显的下降趋势,这一方面印证了GS的不稳定性,一方面表明其结果显示的不准确性(结果数量超过1 000时显示数量存在较大误差)。
图3显示了对于不同年代数据而言检索工具的性能。
图3呈现了不同年代WoS和GS检索数量的变化趋势。整体上看,GS具有较高的结果产量,这一情况在1900-1990年之间表现相对明显。然而,GS的数据优势并不绝对,而且这一数量结果包含了大量重复数据和嘈杂结果。而且,在GS具有大量噪音数据的情况下,WoS仍然在2011-2015年这一年代区间获得了更多的检索结果,体现了WoS在这一时间阶段的性能优势。
总之,WoS和GS的性能受检索词(领域)和数据年代的影响而不同,WoS更加稳定,数据量平稳增加,2011-2015年期间的数据结果比GS更多。
33案例研究
331引文跟踪与定题跟踪
我们从化学领域引文量较大同时持续受关注的热点文章中选取7篇进行引文跟踪案例分析。GS平均3~4天获得1次引文跟踪结果,WoS平均每周获得1次跟踪结果。图4显示了WoS和GS引文跟踪的分析结果。
从引文跟踪数量来看,WoS跟踪结果由实际产生的引文数量决定,可获得全部引文信息,而GS邮件仅能显示10或20条引文信息,超过设定数量的引文无法跟踪。TRG在2月19日收到WoS引文跟踪82条,全部可追溯原文。无论是跟踪结果总数,还是单篇文章的跟踪结果,WoS都比GS更具优势。这是WoS引文跟踪工具的性能体现,这一优势对于短期内引用数量大的文章尤为突出。 从跟踪结果与实际增量的情况分析,WoS跟踪结果与实际引文增量相当,这体现了它数据的稳定性以及跟踪的全面性和及时性。GS跟踪结果与实际增量差距悬殊,一方面受其跟踪数量的限制,无法跟踪到超过20条的引文数据,一方面它自身数据的不稳定性也对起产生了影响,如EFM跟踪结果比实际增量要高,这就是其数据不稳定造成的。图4检索工具引文跟踪记录
根据检索词测试结果,选取“crystal facet”、crystal facet、“perovskite”、“graphene”在标题字段做定题跟踪案例分析,选取“Modrich P”在作者字段做定题跟踪。WoS每周发送1次定题跟踪结果,GS根据跟踪结果随时发送。跟踪结果如图5所示。图5检索工具定题跟踪记录
WoS定题跟踪只适用于Web of Science核心合集数据库,检索范围大大受限。
WoS定题跟踪与其引文跟踪一样,均可获得所有跟踪记录,不受数量限制,不会遗漏最新的检索信息。从跟踪结果与实际增量的关系来看,WoS跟踪结果与实际增量相匹配,GS跟踪结果严重不足,同时由于数据不稳定,“graphene”实际增量出现了急剧减少。
综合评测结果,WoS具有稳定而实用的引文跟踪和定题跟踪能力。
332重叠性和特有性
为了保证文献结果隶属于化学领域,并且最大程度限制文献范围,防止过多噪音文献的产生,我们选定化学家保罗·莫德里奇的文章进行案例分析,分别在WoS和GS中搜集作者字段为“Modrich P”的文献,获得表1结果如下。
从文献来源来看,WoS独有文献全部来源于不同的期刊,其中一种期刊,GS未收录,其中两篇文献GS收录了期刊但是没有收录这两篇文章,另外两篇文章GS有收录该期刊的此文章,却GS没能根据作者字段检索到该文献。这说明,GS在SCI期刊收录范围和文献覆盖范围不够全面,不能搜到足够的SCI文章。同时,将未能根据作者字段检索到文献的情况,与发现的检索错误结果的情况相结合,也显示了GS检索准确性不高。GS独有文献来源,有40%的谷歌专利,说明GS比WoS具有更广泛的文献来源,另外有267%的不确定文献来源的记录,呈现出GS数据范围大而不确定。
4结论及探讨
41从检索到发现的新思路
科学研究是一个依赖信息及其分析处理的过程[10]。Web of Science检索平台具有强大的分析功能,然而因为它对于Google Scholar等免费搜索引擎的诸如数量、范围、操作习惯等方面的相对弱势,并没有得到广大科学研究人员的广泛利用,至少没有得到足够的有效利用。实际上,Web of Science不但具有极强的筛选和精炼的性能,而且它所提供的诸多分析功能,能为用户提供需多有关学科和科研课题的数据分析,帮助科研机构和人员获得学科发展、科研趋势、课题态势等相关报告,获得重要的科研信息,从中发现问题。研究生还可以利用其分析结果帮助自己选题等等。
研究人员应当掌握WoS的检索和分析技能,不能完全依赖GS模式。因为抛弃WoS不仅会错过一些专业性的分析结果,还可能遗失重要文献,也有可能在目标确定与筛选中浪费更多时间。
我们需要提醒科研人员,包括研究生,确定文献的检索不能支撑科研活动,简单的跟踪他人的研究成果也无法满足科研需求。发现学科领域的科研趋势甚至交叉学科的问题、冲突、空白,提出问题,探索解决方案才是关键[10]。因此,提高科研能力的着眼点在于检索技能和发现技能两方面,而发现技能是重点。
图书馆需要认识到自身知识服务的关键价值在于帮助用户解决发现问题的困难,如学科分析,科研趋势等问题。这些用户很难获得却能从中获益的分析成果是图书馆助力科研的关键。图书馆所提供的服务应该包括文献检索、文献获取、资源保障,以及学科分析、态势分析、专题评估等增值服务。
因此,图书馆资源利用和服务模式可以双管齐下。一方面针对诸如Web of Science等专业数据库与免费搜索引擎的差异,着力进行检索技能的培训。一方面,用户掌握专业的分析技能并进行分析得出分析报告需要耗费相当的时间和精力,难度较大[10]。图书馆可针对这种需求进行发现性知识服务。
42文检技能服务
技能服务尚且需要在以下几方面进行加强和提高。首先,需要深入发掘专业数据库与免费学术搜索引擎之间的差异、利弊。着重力量引导用户发现适合自身科研的专业数据库的优势和不可或缺性,针对专业数据库的优势进行宣传推广。在培训中,重点说明专业数据库相对免费搜索引擎的不可取代性。检索技能培训针对各数据库与一般检索方式的差异进行。其次,进一步强化专业数据在结果精炼和排序上的优势,利用实例进行操作培训的同时,突出其效率优势。另外,强调专业数据库的引文分析功能,更为全面的指出利用此功能可获得的分析报告,使用户尽可能多地了解其可实现的结果,在此基础上针对科研用户重点需求进行案例讲解。如:学科态势分析、学科影响力分析、如何利用其进行论文开题等等。
总之,技能服务必须考虑不同学科不同层面用户的不同需要有针对性地进行。一方面针对操作差异进行检索技巧培训,一方面强调专业数据库的优势以及利用它可以实现用户哪些需求。
43数据分析服务
在大数据的时代,依靠用户自己解决海量数据的阅读和分析问题是不现实的,因此,如何进行数据分析,得出用户需求的分析报告是图书馆知识服务的关键。
助力科研的分析服务就是一种类似“智库”的学科性知识服务。图书馆可以利用自身数据资源和技术资源,从不同层面推广协助用户发现的分析服务。在学校机构层面,可以定期向学校提交学科影响力分析报告。在院系及科研单位层面,可以根据不同学科的特定需求,定期进行学科态势分析、学科成果分析、科研人员影响力分析等等。在课题组及特定用户层面,可以针对用户的个性化需求,进行定题分析等等。将科研人员需要获得而又难以获得的信息,以增值服务的模式进行推展。减少科研单位和科研人员耗费在数据分析上的时间和精力,增加科研用户发现新信息的可能性。 参考文献
[1]Walters,WH..Comparative recall and precision of simple and expert searches in Google Scholar and eight other databases[J].Libraries and the Academy,2001,11(4):972-1006.
[2]Audrey Baneyx.“Publish or Perish”as citation metrics used to analyze scientific output in the humanities:International case studies in economics,geography,social sciences,philosophy,and history[J].Arch.Immunol.Ther.Exp.,2008,(56):363-371.
[3]Lutz Bornmann,Werner Marx,Hermann Schier,Erhard Rahm,Andreas Thor,Hans-Dieter Daniel.Convergent validity of bibliometric Google Scholar data in the field of chemistry—Citation counts for papers that were accepted by Angewandte Chemie International Edition or rejected but published elsewhere,using Google Scholar,Science Citation Index,Scopus,and Chemical Abstracts[J].Journal of Informetrics,2009,(3):27-35.
[4]Anne-Wil Harzing.A longitudinal study of Google Scholar coverage between 2012 and 2013[J].Scientometrics,2014,(98):565-575.
[5]Simona ?tirbu,Paul Thirion,Serge Schmitz,Gentiane Haesbroeck,Ninfa Greco.The Utility of Google Scholar When Searching Geographical Literature: ComparisonWith Three Commercial Bibliographic Databases[J].The Journal of Academic Librarianship,2015,(41):322-329.
[6]耿海英,肖仙桃.Web of Science和Google Scholar引文检索功能比较[J].图书与情报,2007,16(3):100-102.
[7]陶慧卿,潘卫,庄琦.从引文分析的角度比较Google Scholar与Web of Science的优势与不足[J].图书馆杂志,2008,27(12):29-35.
[8]任静,孙建军.Web of Science与Google Scholar的引文分析比较研究[J].情报科学,2011,29(11):1687-1692.
[9]袁顺波,庞冬妮.国际知名检索工具引文功能的比较分析——以Web of Science、Scopus与Google Scholar为例[A].见:2013年第三届全国情报学博士生学术论坛论文集[C].2013.
[10]张晓林.研究图书馆2020:嵌入式协作化知识实验室[J].中国图书馆学报,2012,38(197):11-20.
(本文责任编辑:孙国雷)
〔关键词〕Web of Science;Google Scholar;文献检索;引文分析;学术检索平台分析
DOI:10.3969/j.issn.1008-0821.2016.08.020
〔中图分类号〕G2549〔文献标识码〕A〔文章编号〕1008-0821(2016)08-0103-06
〔Abstract〕From the perspective of depth using the data resources and power of scientific research,analysis of the Web of Science and Google Scholar performance in the field of chemistry.Taking comparison and case analysis,from the retrieval performance,this paper analyzed performance,coverage,citation tracking,topic tracking,etc.Web of Science has the authority,stability,functional advantages,but its performance had yet to make full use of.Library needed to dig deeper into the data resources and practical value,this paper proposed the search to discovery service idea,and promoted two-way service mode on skills and analysis.
〔Key words〕Web of Science;Google Scholar;literature retrieval;citation analysis;academic analysis retrieval platform
数据资源的挖掘与利用对科学研究和学科发展有着至关重要的作用。做好科研工作,必须具备高效的获取、筛选、使用,甚至发现信息的能力,每个科研工作者都需要掌握文献检索和分析技能。就图书馆而言,若想助力科研提升资源服务能力,必须了解科学研究的实际流程和需要,了解主要检索平台和数据库的性能和优缺点,深入挖掘并充分利用数字资源来服务用户。然而,窥探现今商业数据库的利用现况,大部分用户对图书数资源的利用仍然停留在获取下载权限上,图书馆对于科研用户的检索分析、知识发现等方面的支持不够有力,图书馆数字资源服务在助力科研方面仍有待深入。
1研究目的与现状
本次研究以资源利用和服务为导向,根据检索实验结果,评估Web of Science在化学领域的性能,将其与科研人员经常使用的学术搜索引擎Google Scholar相比较。期待通过对比分析和实证分析发现Web of Science在化学领域的价值关键,以此探究提高科研效率和能力的服务途径。
早期研究指出WoS的优势主要在于其权威性和专业的引文分析功能,在后来的研究中GS在准确性、相对查全率、检索能力方面变现有所提高[1]。
国外研究指出在人文科学中WoS作为常用的文献数据资源对于研究者是不利的,相对而言GS在人文领域提供了更好的计算指标和更全面的覆盖面积[2]。在化学领域WoS等三大商业数据库具有明显相似性,而GS与其差异明显,文章获得率不及WoS(GS查到文献1 747篇,WoS查到文献1 837篇),引文数量也有较大差距(GS引文总量9 320,WoS引文总量44 502)[3]。此后有研究指出,在化学和物理领域GS经过一阶段的显著增长后呈现稳定增加状态,这种稳定增加使其比以往更适合进行研究评估和文献计量学研究[4]。在地理领域GS具有更广泛的结果数量,然而却不具备可替代商业数据库的绝对优势,在人文地理领域GS表现更好,而在自然地理领域WoS表现更好,GS相对WoS等商业数据库而言在检索简单的同时,处理检索结果的文献分析功能较弱,不利于快速排查[5]。
国内的相关研究指出WoS胜在权威性和引文功能,而GS文献类型更丰富,但重复性大[6]。从被引频次的角度分析WoS更加系统,GS相对不够稳定[7]。从引文数量、类型、重复率等方面分析,认为WoS更具权威性,但在图书情报领域GS也可以作为引文分析工具[8]。从用户角度出发,考虑检索功能和引文评价指标来看,WoS的引文功能优于GS[9]。然而,从科学研究的需求角度出发,仍然缺少对于WoS性能的系统分析,缺少WoS等商业数据平台的利用剖析,对于其数字资源在不同学科的价值也不够全面。
21文献检索
选取检索词在两个文献检索平台上进行相同的检索操作。选取的检索词必须是化学领域广泛使用的,具有代表性的,并且可以提供足够的检索结果以供数据分析,包括单词、词组、分子式。
严格执行相同的检索条件和检索过程,分别将关键词置于双引号中或不使用双引号(科研人员通常检索习惯),在“标题”字段和“主题”字段(默认字段)进行检索,记录检索结果。 为了获得更多的结果数量满足讨论需要,文献检索期间每周进行两次相同过程的检索。使用Endnote和Excel进行结果处理。
22数量分析
使用Excel对结果数据进行处理,制作图表分析研究数据在数量上的差异、变化或变量之间的依赖关系。
23引文分析——案例分析
确定引文跟踪和定题跟踪的文献题目和检索内容,分别在两个检索工具中定制跟踪服务。从时效性和结果数量上比较引文跟踪和定题跟踪的性能。
使用Excel进行数量分析,人工对跟踪结果进行时效性分析。使用Endnote筛选重复文献。
24重叠与独有
基于一系列化学文献计算检索工具的传统重复性(TO)与相对重复性(RO)。
传统重复性:
TO=A中文献∩B中文献A中文献∪B中文献×100%
相对重复性:
RO(A)=A中文献∩B中文献A中文献×100%
RO(B)=A中文献∩B中文献B中文献×100%
3结果及分析
31检索性能
从检索方式和字段上来看,WoS更加专业,检索模式更加多样,检索字段更为丰富,可提供更为精确的检索组合。特别是WoS具有化学结构检索,这点对于化学领域来说优势相当明显,同时WoS具有地址检索的功能体现出其作为文献检索工具的专业性,引文分析能力更强。
然而,WoS的检索速度不及GS,通常GS可在002~007秒提供检索结果,而WoS却需要1~3秒,这种等待时间令人感到不适。
从筛选的性能上来看,WoS可以进行研究领域、研究方向、文献类型、出版物名称、出版年等15种结果精炼。WoS的精练项目更为细致,更适合进行专业的引文分析。但是WoS语种指令和语种丰富程度不如GS,而且二次检索功能不如GS方便。
从排序性能来看,WoS可根据出版时间、被引频次、相关性等进行15种排序。GS只能根据相关性和日期进行排序。其排序功能不如WoS强大,特别是缺少被引频次排序,仅利用相关性智能显示结果,不能快速找到重点文章。
从原文获取能力上看,WoS不提供原文,提供原文指向链接,是否可获取原文由原文所在数字资源是否被购买而决定,通常在可获得原文的情况在,需要进行2~3次链接。GS自动获取可用全文,直接单击链接即可查看。
从引文分析的角度来看,WoS可以进行检索结果的引文分析,创建引文报告,对相关问题的研究态势进行分析,也可以查看单一文章的被引频次及文章、引用的参考文献、相关文献。GS不能对检索结果进行整体的引文统计和分析,对单一文章可以查看被引频次及文章、相关文章,及其WoS中引用该文献的文章。
32检索结果数量分析
321时间演化及稳定性分析
我们根据8个测试时间WoS与GS的检索记录,观察检索结果与时间的演化关系。图1是每个检索时段检索结果平均数随时间的演化情况。
如图1所示,无论是在主题字段(WoS与GS的默认字段)还是标题字段进行检索,随时间推移,WoS的结果数量均呈现稳定的态势,没有明显波动,核对检索结果数量可见其平稳上升趋势。然而,GS的检索结果随时间推移有明显的浮动显现,图1a中的波动尤为明显,主题检索结果数量起伏较大,极不稳定,图1b标题检索GS表现相对稳定,但第二次检索结果明显减少。图1检索结果时间演化
从时间演化上分析,WoS数据更为稳定,GS虽然结果产量巨大,但具有明显的不稳定性,且已有研究结果指出了GS检索结果的重复性和嘈杂性,因而,我们并不能从其结果数量大说明其更有利于化学科研。
322化学领域数量性能
图2显示了WoS和GS在标题字段进行检索的性能。
图2呈现了8次检索测试中各个检索词检索结果的变化情况,从图中可以看出,WoS中各检索词的结果变化稳定,呈现平缓上升趋势,“graphene”的上升趋势明显。
GS检索结果变化波动较大,几乎每次检索都有浮动,甚至出现多次检索结果急剧减少的情况,“graphene”和“hydrothermal”科研产出持续增多,在GS的2、4、6次检索中却出现了明显的下降趋势,这一方面印证了GS的不稳定性,一方面表明其结果显示的不准确性(结果数量超过1 000时显示数量存在较大误差)。
图3显示了对于不同年代数据而言检索工具的性能。
图3呈现了不同年代WoS和GS检索数量的变化趋势。整体上看,GS具有较高的结果产量,这一情况在1900-1990年之间表现相对明显。然而,GS的数据优势并不绝对,而且这一数量结果包含了大量重复数据和嘈杂结果。而且,在GS具有大量噪音数据的情况下,WoS仍然在2011-2015年这一年代区间获得了更多的检索结果,体现了WoS在这一时间阶段的性能优势。
总之,WoS和GS的性能受检索词(领域)和数据年代的影响而不同,WoS更加稳定,数据量平稳增加,2011-2015年期间的数据结果比GS更多。
33案例研究
331引文跟踪与定题跟踪
我们从化学领域引文量较大同时持续受关注的热点文章中选取7篇进行引文跟踪案例分析。GS平均3~4天获得1次引文跟踪结果,WoS平均每周获得1次跟踪结果。图4显示了WoS和GS引文跟踪的分析结果。
从引文跟踪数量来看,WoS跟踪结果由实际产生的引文数量决定,可获得全部引文信息,而GS邮件仅能显示10或20条引文信息,超过设定数量的引文无法跟踪。TRG在2月19日收到WoS引文跟踪82条,全部可追溯原文。无论是跟踪结果总数,还是单篇文章的跟踪结果,WoS都比GS更具优势。这是WoS引文跟踪工具的性能体现,这一优势对于短期内引用数量大的文章尤为突出。 从跟踪结果与实际增量的情况分析,WoS跟踪结果与实际引文增量相当,这体现了它数据的稳定性以及跟踪的全面性和及时性。GS跟踪结果与实际增量差距悬殊,一方面受其跟踪数量的限制,无法跟踪到超过20条的引文数据,一方面它自身数据的不稳定性也对起产生了影响,如EFM跟踪结果比实际增量要高,这就是其数据不稳定造成的。图4检索工具引文跟踪记录
根据检索词测试结果,选取“crystal facet”、crystal facet、“perovskite”、“graphene”在标题字段做定题跟踪案例分析,选取“Modrich P”在作者字段做定题跟踪。WoS每周发送1次定题跟踪结果,GS根据跟踪结果随时发送。跟踪结果如图5所示。图5检索工具定题跟踪记录
WoS定题跟踪只适用于Web of Science核心合集数据库,检索范围大大受限。
WoS定题跟踪与其引文跟踪一样,均可获得所有跟踪记录,不受数量限制,不会遗漏最新的检索信息。从跟踪结果与实际增量的关系来看,WoS跟踪结果与实际增量相匹配,GS跟踪结果严重不足,同时由于数据不稳定,“graphene”实际增量出现了急剧减少。
综合评测结果,WoS具有稳定而实用的引文跟踪和定题跟踪能力。
332重叠性和特有性
为了保证文献结果隶属于化学领域,并且最大程度限制文献范围,防止过多噪音文献的产生,我们选定化学家保罗·莫德里奇的文章进行案例分析,分别在WoS和GS中搜集作者字段为“Modrich P”的文献,获得表1结果如下。
从文献来源来看,WoS独有文献全部来源于不同的期刊,其中一种期刊,GS未收录,其中两篇文献GS收录了期刊但是没有收录这两篇文章,另外两篇文章GS有收录该期刊的此文章,却GS没能根据作者字段检索到该文献。这说明,GS在SCI期刊收录范围和文献覆盖范围不够全面,不能搜到足够的SCI文章。同时,将未能根据作者字段检索到文献的情况,与发现的检索错误结果的情况相结合,也显示了GS检索准确性不高。GS独有文献来源,有40%的谷歌专利,说明GS比WoS具有更广泛的文献来源,另外有267%的不确定文献来源的记录,呈现出GS数据范围大而不确定。
4结论及探讨
41从检索到发现的新思路
科学研究是一个依赖信息及其分析处理的过程[10]。Web of Science检索平台具有强大的分析功能,然而因为它对于Google Scholar等免费搜索引擎的诸如数量、范围、操作习惯等方面的相对弱势,并没有得到广大科学研究人员的广泛利用,至少没有得到足够的有效利用。实际上,Web of Science不但具有极强的筛选和精炼的性能,而且它所提供的诸多分析功能,能为用户提供需多有关学科和科研课题的数据分析,帮助科研机构和人员获得学科发展、科研趋势、课题态势等相关报告,获得重要的科研信息,从中发现问题。研究生还可以利用其分析结果帮助自己选题等等。
研究人员应当掌握WoS的检索和分析技能,不能完全依赖GS模式。因为抛弃WoS不仅会错过一些专业性的分析结果,还可能遗失重要文献,也有可能在目标确定与筛选中浪费更多时间。
我们需要提醒科研人员,包括研究生,确定文献的检索不能支撑科研活动,简单的跟踪他人的研究成果也无法满足科研需求。发现学科领域的科研趋势甚至交叉学科的问题、冲突、空白,提出问题,探索解决方案才是关键[10]。因此,提高科研能力的着眼点在于检索技能和发现技能两方面,而发现技能是重点。
图书馆需要认识到自身知识服务的关键价值在于帮助用户解决发现问题的困难,如学科分析,科研趋势等问题。这些用户很难获得却能从中获益的分析成果是图书馆助力科研的关键。图书馆所提供的服务应该包括文献检索、文献获取、资源保障,以及学科分析、态势分析、专题评估等增值服务。
因此,图书馆资源利用和服务模式可以双管齐下。一方面针对诸如Web of Science等专业数据库与免费搜索引擎的差异,着力进行检索技能的培训。一方面,用户掌握专业的分析技能并进行分析得出分析报告需要耗费相当的时间和精力,难度较大[10]。图书馆可针对这种需求进行发现性知识服务。
42文检技能服务
技能服务尚且需要在以下几方面进行加强和提高。首先,需要深入发掘专业数据库与免费学术搜索引擎之间的差异、利弊。着重力量引导用户发现适合自身科研的专业数据库的优势和不可或缺性,针对专业数据库的优势进行宣传推广。在培训中,重点说明专业数据库相对免费搜索引擎的不可取代性。检索技能培训针对各数据库与一般检索方式的差异进行。其次,进一步强化专业数据在结果精炼和排序上的优势,利用实例进行操作培训的同时,突出其效率优势。另外,强调专业数据库的引文分析功能,更为全面的指出利用此功能可获得的分析报告,使用户尽可能多地了解其可实现的结果,在此基础上针对科研用户重点需求进行案例讲解。如:学科态势分析、学科影响力分析、如何利用其进行论文开题等等。
总之,技能服务必须考虑不同学科不同层面用户的不同需要有针对性地进行。一方面针对操作差异进行检索技巧培训,一方面强调专业数据库的优势以及利用它可以实现用户哪些需求。
43数据分析服务
在大数据的时代,依靠用户自己解决海量数据的阅读和分析问题是不现实的,因此,如何进行数据分析,得出用户需求的分析报告是图书馆知识服务的关键。
助力科研的分析服务就是一种类似“智库”的学科性知识服务。图书馆可以利用自身数据资源和技术资源,从不同层面推广协助用户发现的分析服务。在学校机构层面,可以定期向学校提交学科影响力分析报告。在院系及科研单位层面,可以根据不同学科的特定需求,定期进行学科态势分析、学科成果分析、科研人员影响力分析等等。在课题组及特定用户层面,可以针对用户的个性化需求,进行定题分析等等。将科研人员需要获得而又难以获得的信息,以增值服务的模式进行推展。减少科研单位和科研人员耗费在数据分析上的时间和精力,增加科研用户发现新信息的可能性。 参考文献
[1]Walters,WH..Comparative recall and precision of simple and expert searches in Google Scholar and eight other databases[J].Libraries and the Academy,2001,11(4):972-1006.
[2]Audrey Baneyx.“Publish or Perish”as citation metrics used to analyze scientific output in the humanities:International case studies in economics,geography,social sciences,philosophy,and history[J].Arch.Immunol.Ther.Exp.,2008,(56):363-371.
[3]Lutz Bornmann,Werner Marx,Hermann Schier,Erhard Rahm,Andreas Thor,Hans-Dieter Daniel.Convergent validity of bibliometric Google Scholar data in the field of chemistry—Citation counts for papers that were accepted by Angewandte Chemie International Edition or rejected but published elsewhere,using Google Scholar,Science Citation Index,Scopus,and Chemical Abstracts[J].Journal of Informetrics,2009,(3):27-35.
[4]Anne-Wil Harzing.A longitudinal study of Google Scholar coverage between 2012 and 2013[J].Scientometrics,2014,(98):565-575.
[5]Simona ?tirbu,Paul Thirion,Serge Schmitz,Gentiane Haesbroeck,Ninfa Greco.The Utility of Google Scholar When Searching Geographical Literature: ComparisonWith Three Commercial Bibliographic Databases[J].The Journal of Academic Librarianship,2015,(41):322-329.
[6]耿海英,肖仙桃.Web of Science和Google Scholar引文检索功能比较[J].图书与情报,2007,16(3):100-102.
[7]陶慧卿,潘卫,庄琦.从引文分析的角度比较Google Scholar与Web of Science的优势与不足[J].图书馆杂志,2008,27(12):29-35.
[8]任静,孙建军.Web of Science与Google Scholar的引文分析比较研究[J].情报科学,2011,29(11):1687-1692.
[9]袁顺波,庞冬妮.国际知名检索工具引文功能的比较分析——以Web of Science、Scopus与Google Scholar为例[A].见:2013年第三届全国情报学博士生学术论坛论文集[C].2013.
[10]张晓林.研究图书馆2020:嵌入式协作化知识实验室[J].中国图书馆学报,2012,38(197):11-20.
(本文责任编辑:孙国雷)