论文部分内容阅读
[摘 要] 基于论文发表的普赖斯定律,以5本高被引核心期刊《科学学研究》《科研管理》《科学学与科学技术管理》《中国科技论坛》《研究与发展管理》刊载的1141篇文献为样本,实证检验论文被引频次的影响因素。结果表明:(1)论文被引频次整体程度不高,论文被引频次对刊载时间有较强依赖性的同时,二者之间也存在非线性关系;(2)作者是否合作、论文是否定量研究、论文下载次数、期刊影响因子与论文被引频次之间显著正相关,而期刊年发文量与论文被引频次之间显著负相关,且第一作者所在机构、性别以及论文受到基金资助的数量、期刊主办方等与论文被引频次之间不存在显著相关性。本研究的主要发现是论文特征决定论文被引频次,并得出相关启示,提出研究不足及未来方向。
[关键词] 科技管理 核心期刊 论文被引频次 影响因素
[中图分类号] G237 [文献标识码] A [文章编号] 1009-5853 (2016) 02-0057-07
The Influencing Factors of the S&T Management Core Journals Cited Frequency
Meng Fanrong Zheng Ye Yang Ruoyu
(School of Public Policy and Administration, Xi’an Jiaotong University, Xi’an, 710049)
[Abstract] Based on the Price Law for paper publication, this study examines the factors that influence the cited frequency of papers by taking the 1141 literatures published in five highly cited core journals as the samples which are Studies in Science of Science, Science Research Management, Science of Science and Management of S.& T., Forum on Science and Technology in China and R&D Management. The result shows: (1) the whole degree of the cited frequency of papers is not high, the cited frequency of papers strongly depends on the time of publication, and in the meanwhile there is a non-linear relationship between them; (2) there is significant positive correlation between whether the authors cooperate, whether there is quantitative studies in these papers, the number of times that the papers are downloaded, journal impact factors and the cited frequency of papers. However, there is obvious negative correlation between the annual quantity of published articles of the journal, and there is no significant correlation between the institution where the first author is from, his gender, the number of papers that are funded, journal organizer, etc. and the cited frequency of papers. The main finding of this study is that paper features decide the cited frequency of papers, and relative inspiration is drawn. It also proposes the shortcomings in this study and the future directions.
[Key words] Management of science and technology Core journals Cited frequency Influencing factors
1 引 言
我国的科技管理类期刊是科技管理研究的重要学术载体,是知识创新和传播、科技成果转化为生产力的重要纽带,对于反映当前及今后一段时期内国家科技管理的发展水平,以及提升国家的科技创新能力具有重要的指导意义[1]。在当前科技管理类期刊蓬勃发展的今天,国内科技管理期刊论文的影响力究竟如何?具体而言,这些期刊论文的被引频次情况是怎样的?进一步地,影响科技管理期刊论文被引频次的决定性因素有哪些?基于此,本研究在分析国内外论文引用影响因素的基础上,以5本国内科技管理高被引核心期刊2012年刊载的1141篇研究论文作为分析样本,实证检验科技管理核心期刊论文被引频次的影响因素,旨在帮助学者明确如何扩大其学术论文的影响力和公信力,有利于科研机构制定合适的科研奖励和认定政策,同时也为期刊出版社组稿、编辑等业务流程的决策提供科学参考。 2 文献回顾与研究假设
2.1 论文被引频次及其影响因素
基于被引频次的引文分析概念最早是由格罗斯(Gross)等人于1927年提出,最初作为评价科学研究重要性的一项重要指标,之后与同行评议(Peer review)一起作为衡量论著影响力的重要指标[2]。论文的引用作为一项复杂的行为,受到诸多客观因素甚至偶然因素的影响(武夷山,2009)[3]。1962年加菲尔德(Garfield)提出了论文被引用的15种动机,1965年洛佩兹(Lipetz)将引用行为进行分类,揭开了引用行为研究的序幕,但二者皆从理论方面进行探讨,缺少相关的实证证据,直到2008年伯恩曼(Lutz Bornmann)和丹尼尔(Hans Daniel)以实证研究阐述科学家引用某篇文章的原因[4]。
目前国内外学者对论文被引频次的影响因素展开了一系列研究。国外近期研究成果中,维埃拉(Vieira)和戈麦斯(Gomes,2010)的研究发现,合作者数量、作者机构数量、文章篇幅/页数、参考文献数量、期刊影响因子等会直接影响论文的引用[5],王(Wang,2012)阐释了第一作者研究水平和论文质量是影响论文被引频次的决定性因素[6],特吕茨勒(Thelw,2013)等强调期刊的影响因子、参考文献平均被引数量对论文被引频次影响最大[7],乔伊斯(Joyce,2014)的研究表明文章特征(研究主题、来源期刊、作者机构因素)等对论文被引频次的影响最显著[8]。与国外研究结论类似,国内一些学者近期的相关研究,也发现了参考文献(姜磊等,2015)、科研合作(苏芳荔,2011)、开放存取论文下载(牛昱昕等,2012)、引用习惯(杨立军等,2012)、内容质量(孙书军等,2010)、论文下载频次与期刊影响因子(张小强,2011)、期刊载文数量(王群英等,2012)等因素会对论文被引频次产生不同程度的影响。
目前的研究多从单一方面探讨与论文被引频次的关系,缺乏系统整合与梳理,国内缺少相关的实证研究,对于科技管理领域期刊论文被引频次的研究目前还未出现。
2.2 研究假设的提出
2.2.1 作者特征与被引频次
通常情况下,研究人员非常关心自己的研究成果被国内外同行认可,如果一项成果在发表后一直无人问津,那么对于科研人员和科学进步而言,很难谈及它的意义[9]。为此科研人员会通过增加作者数量,与高知名度机构、作者合作等方式来提高论文发表后的影响力。加兹尼(Gazni)(2011)等通过对2000—2009年哈佛大学发表的124937篇论文进行分析,结果发现作者数量与论文被引次数之间呈显著正相关[10]。苏芳荔(2011)以图情类影响力最大的4种期刊在2000—2009年的载文量与被引频次作为分析样本,采用符号检验法验证了合作发表论文影响力要明显高于独立(无合作)发表的论文[11]。乔伊斯(Joyce,2014)以1945—2013年Web of Science烧伤科被引频次最高的100篇论文作为分析样本,结果发现论文作者所在机构是影响论文影响力的重要特征之一。上述研究发现所得出的结论都与作者特征密切相关。在此,本研究提出假设1:
H1:作者特征与论文被引频次显著正相关,即:作者机构越有名,合作人数越多,则论文被引频次越高。
此外,现有研究在考虑作者特征方面忽略了性别因素,而高校科研院所中女性研究人员也占了一定的比例,在此本研究将性别因素纳入作者特征中进行分析。
2.2.2 论文特征与被引频次
尽管学术质量决定论文的被引频次,但除了论文质量以外,论文自身的其他特征,如参考文献数量和长度、论文研究方法、资助基金数量、下载频次等也会对论文被引频次产生影响。孙书军等(2010)通过对两篇发表在国内期刊的高被引论文分析,认为论文的被引频次决定于论文的内容质量。简琳等(2011)通过对6个学科的455篇论文被引的文本因素进行分析,结果发现文献长度、参考文献数量对论文被引频次的影响在不同学科间存在着显著差异[12]。张小强(2011)、丁佐奇等(2011)、牛昱昕等(2012)分别以中国知网、中国知网CSCD与CHSSCD,以及中国科技论文在线等数据库刊载的论文作为分析样本,结果都表明论文下载频次与论文被引情况显著正相关[13-15]。库卡尼(kulkarni)(2007)等以JCR影响因子最高的三种医学期刊刊登的多篇研究论文为样本,结果发现有产业资助支持的论文在发表后的被引用次数更多[16]。韦斯特(West)和麦尔维尼(Mellwaine)(2002)的研究结果表明文章所研究的物质类型和方法与论文引用次数无关,但是莫希特(Mohit,2007)的研究结论确认为相对于实验设计不严格的临床文章而言,涉及到方法保障的基础科学、临床文章会被引用的更多,并且这些文章都有充分的数据支撑和论证[17-18]。基于上述研究结论,在此提出假设2:
H2:论文特征与论文被引频次显著正相关,即:论文受到资助的基金数量越多,论文下载频次越多,论文越偏向于定量研究,则论文的被引频次越高。
3 研究设计
3.1 研究样本与数据来源
本研究选取国内科技管理研究领域的5本高被引期刊作为研究对象,它们分别是:《科学学研究》《科研管理》《科学学与科学技术管理》《中国科技论坛》《研究与发展管理》。这5本期刊在国内学界拥有良好的口碑,办刊时间迄今已有30多年,都被CSSCI数据库和北大核心期刊数据库所收录,影响因子较高,并且除《中国科技论坛》外,其他4本期刊都是国家自然科学基金委(NSFC)管理学部认定的A/B类重要期刊(见下表1)。本文采用的数据来源于这5本期刊在2012年度发表的1141篇研究论文,这些论文都可以在中国知网(CNKI)上轻松获取。之所以选择2012年刊载的文献是因为,根据普赖斯定律,文献一般在其发表2年后才开始达到引用峰值。另外,本研究的数据采集时间是2015年7月20日—7月26日。 3.2 变量识别与测量
本研究将论文被引频次作为因变量,作者特征和论文特征作为自变量。其中,作者特征包含第一作者所在机构、第一作者性别、作者是否合作三个维度,同时,论文特征包含论文是否定量研究、论文受到基金资助数量以及论文下载频次三个维度。将期刊特征作为控制变量,具体包含期刊全年发文量、期刊主办方与期刊影响因子等三个方面。有关研究变量的名称、代码及测量等信息如表2所示。
3.3 工具与方法
在社会科学研究中,有时因变量常常是计数类型的变量,诸如犯罪次数、人口迁移次数、看病次数等,它们都是某种事件发生数,取值为0、1、2、3……离散的非负整数。计数变量的标准模型为泊松分布,也就是说泊松回归模型(Poisson Regression Model)是建立在泊松分布基础上的回归模型(Cameron等,1998),它构成了对计数变量进行多元量化分析的起点。泊松回归除了可以接受虚拟编码方式的年龄、性别、机构等分类自变量外,还可以直接接受连续型自变量,因此本研究适宜采用泊松回归探讨解释变量与被解释变量之间的关系[19]。对于个体i,记被解释变量为Yi,假设Yi=yi的概率由参数为λi的泊松分布所决定,在此,本研究构建泊松回归模型如公式(1)所示:
(1)
在公式(1)中:λi为泊松到达率(Poisson arrival rate),表示事件发生的平均次数,由解释变量xi所决定。泊松分布的期望与方差等于泊松到达率λi,λi也可称之为发生率比(Incidence Rate Ratio,简称IRR),它表示当解释变量xi增加微小量时,事件的平均发生次数将增加多少百分点。本研究拟采用STATA 12.0软件进行泊松回归分析。
4 结果分析
4.1 论文被引频次状况的整体比较
图1描绘了5本高被引期刊按出版期数进行分类汇总的论文均篇被引频次分布情况。从总体上看,除《中国科技论坛》外,其他4本期刊论文的被引频次都呈现出较强的时间依赖性(尤其是《科研管理》和《研究与发展管理》),发表在年初的文献,其被引频次要比发表在年中和年末文献的被引频次高。5本期刊中,《科研管理》刊载的论文被引频次最高,体现该刊在国内已经具有较强的影响力;《科学学研究》期刊论文的被引频次相对《科研管理》要稍显逊色。5本期刊每期刊载文献的均篇被引频次的差异性明显,波动性较大,最高达到14.3左右,最低只有3.3左右,这可能是由于论文研究主题的“冷热”等因素造成。总之,尽管5本期刊刊载的论文其被引频次与刊载时间之间存在着一定的依赖性,但是图1中的变化趋势同时反映了论文刊载时间与被引频次之间存在着非线性相关性。
4.2 描述性分析
表3报告了变量的描述性统计分析结果,从中可以看出所有论文的均篇被引频次仅为7.8279,这说明目前论文被引频次整体程度不高。由于发表时间较短,某些有潜力在未来成为高被引的文章可能被忽略,需要再等待一段时间文献的价值才会得以体现。此外,作者特征自变量的均值表明第一作者所在机构大多来自国内“211”和“985”重点院校,男性作者数量要多于女性作者,合作论文数量要略多于独作论文的数量。更进一步地,论文特征自变量均值反映出目前定量研究论文数量要明显多于定性研究论文数量,均篇论文受到1.8个左右基金项目的资助,论文下载频次之间的差距非常大。最后,期刊特征控制变量反映出期刊影响因子较高,平均在2分以上,主办方大多是几家机构联合办刊,年度发文总量之间的差距也比较大。另外,所有研究变量的VIF值均小于10,尤其是自变量的VIF值都保持在1左右,这表明当前变量之间不存在多重共线问题,数据可以直接进行回归分析。
4.3 泊松回归分析
表4报告了论文被引频次影响因素的泊松回归模型分析结果,其中模型1反映了期刊特征控制变量对论文被引频次的影响,模型2是在控制期刊特征的前提下,作者特征对论文被引频次的影响,模型3是在控制期刊特征的前提下,论文特征对论文被引频次的影响,模型2和模型3是为了比较作者特征和论文特征哪个对论文被引频次的影响更显著,模型4是作者特征、论文特征以及期刊特征对论文被引频次影响的全回归模型,目的为了验证前文提出的研究假设。
模型1的回归分析结果显示,期刊年发文量、期刊影响因子与论文被引频次均呈现出显著相关性,且通过5%的统计显著性水平检验,期刊主办方的影响作用不显著。具体而言,期刊年发文量与论文被引频次之间显著负相关,即在控制其他变量的条件下,年发文量越多的期刊其论文平均被引频次反而比年发文量少的期刊低9%左右,这表明论文被引频次更多取决于期刊的质量而并非仅仅依靠期刊刊载论文数量的多少。此外,影响因子与论文被引频次之间显著正相关,表明了在给定其他变量的条件下,影响因子越高的期刊其论文平均被引频次比影响因子低的期刊高93.02%,这也说明了影响因子高的期刊其论文质量也相对较高,受到学界关注度会更大一些,论文被引频次自然也会具有一定优势。
模型2是控制了期刊特征以后,作者特征对论文被引频次的影响。与模型1相比,在加入作者特征自变量以后,期刊特征对论文被引频次的影响有些削弱,但仍然显著。在作者特征变量中,除了作者是否合作变量在10%的显著性水平下与论文被引频次之间存在正相关性以外,作者特征的其他两个变量与论文被引频次之间均不存在显著相关性。在给定其他变量的前提下,作者之间合作发表的论文其论文平均被引频次要比独作发表的论文高出0.27%,这有可能是因为一方面合作的论文作者之间都有明确分工,而且彼此间会进行交流和探讨,论文本身质量会相对高一些。此外,尽管作者机构与作者性别对论文被引频次影响不显著,但是从中也可以反映作者机构、作者性别与论文被引频次之间的负相关性,即重点高校作者的论文被引频次不一定高于非重点高校作者,男性作者的论文被引频次不一定高于女性作者。 模型3是控制了期刊特征后,论文特征对论文被引频次的影响。结果显示出论文特征对期刊特征的影响有明显削弱的趋势,通过与模型2进行比较,论文特征比作者特征对论文被引频次的影响作用更为显著(R2分别为4.12%,30.05%)。在论文特征三个变量中,论文是否是定量研究、论文下载频次均对论文被引频次产生较强的正向影响(分别在5%和1%水平下显著)。具体而言,如果论文是定量研究的话,其论文平均被引频次比非定量研究论文的被引频次高28.8%,这主要是因为作为目前的主流研究范式,通常而言,定量研究论文格式和研究过程比较规范,并且都有理论基础和文献综述研究,因此其被引频次会相对高一些。而对于论文下载次数而言,在给定其他变量的条件下,论文下载次数越高的期刊,其论文平均被引频次比下载次数越低的论文高出3.2%左右。此外,基金资助数量与论文被引频次之间不存在显著相关性,也就是说论文被引频次并不取决于论文所挂基金数量。
模型4是加入所有变量之后的全回归模型,结果与模型1、模型2和模型3相比,发生了较明显的变化。首先,期刊特征变量中,期刊年发文量与论文被引频次之间的负相关性有所增强,而期刊影响因子与论文被引频次之间的正相关性有所减弱,这主要是由于添加作者特征与论文特征变量后导致期刊特征变量的显著性发生了明显变化。其次,在作者特征变量中,第一作者所在机构、性别与论文被引频次之间仍然不存在显著相关性,作者是否合作在10%的显著性水平下与论文被引频次之间存在正相关性,并且较之模型2而言,相关性有所增强,至此假设1得到了部分支持,即仅有论文是否合作与论文被引频次之间存在显著正相关的假设得到了验证,论文越偏向于合作研究,其被引频次也就越高。再次,在论文特征变量中,除了基金资助数量影响作用不显著以外,论文是否定量研究、论文下载次数均与论文被引频次之间呈现显著正相关关系,并且在5%和1%的显著性水平下得到验证,至此假设2得到了部分支持,即论文越偏向定量研究,论文被下载的次数越多,则论文被引频次就越高。总的来说,论文特征比作者特征对论文被引频次的影响作用更显著,这表明对作者而言,要想提高论文被引频次,应该从论文特征出发,努力提高论文质量,保证论文有充分的数据支撑,与此同时可以考虑与高水平机构、学者等进行合作,以此来提高论文的学术影响力和引用频次。
5 结 语
本研究的主要结论包括:首先,5本高被引核心期刊按出版期数进行分类汇总的论文均篇被引频次分布特征表明,尽管刊载的论文被引频次对时间具有较强的依赖性,但与此同时,论文被引频次与论文刊载时间之间也存在着非线性相关性。其次,描述性统计分析的结果反映出当前论文被引频次整体程度不高,第一作者大多来自国内重点院校,男性作者居多,合作论文数量占主导地位,并且定量研究论文数量明显多于定性研究论文,均篇论文受到1.8个左右基金项目资助,论文下载频次之间差距甚大。再次,泊松回归结果表明作者是否合作、论文是否定量研究、论文下载频次、期刊影响因子与论文被引频次之间显著正相关,而期刊年发文量与论文被引频次之间显著负相关,研究假设1和假设2得到了部分支持。与此同时,泊松回归结果也表明论文特征比作者特征对论文被引频次的影响作用更显著。
本研究的启示在于:首先,论文特征等因素比作者特征等因素对论文被引频次而言更重要,所以要想提高论文的影响力应该首先从论文质量内容、数据等入手,同时可以考虑和一些机构及学者进行合作产出高质量论文。其次,并非论文所在的基金项目数越多越好,基金项目数量对论文被引频次影响不显著,更进一步地,第一作者性别与所在机构对论文被引频次的影响也不显著,这也就说明即使第一作者的机构不是著名高校和科研院所,但在论文质量较高的情况下,学术关注度也会得到增加,而且在性别上也不存在差异。再次,期刊编辑部应该严把论文质量关,控制每期刊载的论文数量,在提升期刊论文质量的同时,提高论文的被引频次,逐渐扩大期刊的学界影响力。本研究的缺陷和不足主要表现在所选取的研究期刊较少,研究结论可能缺乏较广泛的普适性,另外,对于影响因素的总结目前仅局限于作者特征和论文特征两个层面,今后有必要选取更大样本,从多学科比较的视角,系统梳理和验证论文被引频次的影响因素。
注 释
[1]许静.关于科技管理期刊内容趋同的思考[J].编辑学报,2014(4):347-349
[2]Gross P. L. K., Gross E.M.. College Libraries and Chemical Education [J]. Science, 1927(66):385-389.
[3]武夷山.文献引用的可控与不可控[J]. 科技导报,2008(4):99
[4]鲍玉芳,马建霞.科学论文被引频次预测的现状分析与研究[J].情报杂志,2015(5):66-71
[5]Vieira E.S., Gomes J.A.N.F.. Citations to Scientific Articles: Its Distribution and Dependence on the Article Features[J]. Journal of Informetrics, 2010(1): 1-13
[6]Wang M., Yu G., An S., et al. Discovery of Factors Influencing Citation Impact Based on A Soft Fuzzy Rough Set Model[J]. Scientometrics, 2012 (3): 635-644
[7]Didegah F., Thelwall M., Which Factors Help Authors Produce the Highest Impact Research? Collaboration, Journal and Document Properties[J]. Journal of Informetrics, 2013(4): 861-873 [8]Joyce C.W., Kelly J.C., Sugrue C.. A Bibliometric Analysis of the 100 Most Influential Papers In Burns[J]. Burns, 2014(1): 30
[9]孙书军,朱全娥.内容质量决定论文的被引频次[J].编辑学报,2010(2):141-142
[10]Gazni A., Didegah F.. Investigating Different Types of Research Collaboration and Citation Impact: A Case Study of Harvard University’s Publications[J]. Scientometrics, 2011(2): 251-265
[11]苏芳荔.科研合作对期刊论文被引频次的影响[J].图书情报工作,2011(10):144-148
[12]简琳,何静,周剑.论文被引的文本因素分析:多学科视角[J].图书情报工作,2011(20):32-35
[13]张小强.期刊下载频次与被引频次及影响因子相关性:以中国知网CSCD与CHSSCD刊物为样本的计量分析[J].情报理论与实践,2011,(8):36-40
[14]丁佐奇,郑晓南,吴晓明.科技论文被引频次与下载频次的相关性分析[J].中国科技期刊研究,2010(4):467-470
[15]牛昱昕,宗乾进,袁勤俭.开放存取论文下载与引用情况计量研究[J].中国图书馆学报,2012(4):119-127
[16]Kulkarni A. V., Busse J. W., Shams I.. Characteristics Associated With Citation Rate of the Medical Literature[J]. Plos One, 2007(5): E403
[17]West R., Mellwaine A.. What Do Citation Counts Count for In the Field of Addiction? An Empirical Evaluation of Citation Counts and Their Link With Peer Ratings of Quality[J]. Addiction, 2002(5): 501-504
[18]Bhandari M., Busse J., Devereaux P.J., et al. Factors Associated With Citation Rates In the Orthopedic Literature[J]. Canadian Journal of Surgery, 2007(2): 119
[19]郭志刚,巫锡炜.泊松回归在生育率研究中的应用[J].中国人口科学,2006(4):2-15
(收稿日期:2015-11-09)
[关键词] 科技管理 核心期刊 论文被引频次 影响因素
[中图分类号] G237 [文献标识码] A [文章编号] 1009-5853 (2016) 02-0057-07
The Influencing Factors of the S&T Management Core Journals Cited Frequency
Meng Fanrong Zheng Ye Yang Ruoyu
(School of Public Policy and Administration, Xi’an Jiaotong University, Xi’an, 710049)
[Abstract] Based on the Price Law for paper publication, this study examines the factors that influence the cited frequency of papers by taking the 1141 literatures published in five highly cited core journals as the samples which are Studies in Science of Science, Science Research Management, Science of Science and Management of S.& T., Forum on Science and Technology in China and R&D Management. The result shows: (1) the whole degree of the cited frequency of papers is not high, the cited frequency of papers strongly depends on the time of publication, and in the meanwhile there is a non-linear relationship between them; (2) there is significant positive correlation between whether the authors cooperate, whether there is quantitative studies in these papers, the number of times that the papers are downloaded, journal impact factors and the cited frequency of papers. However, there is obvious negative correlation between the annual quantity of published articles of the journal, and there is no significant correlation between the institution where the first author is from, his gender, the number of papers that are funded, journal organizer, etc. and the cited frequency of papers. The main finding of this study is that paper features decide the cited frequency of papers, and relative inspiration is drawn. It also proposes the shortcomings in this study and the future directions.
[Key words] Management of science and technology Core journals Cited frequency Influencing factors
1 引 言
我国的科技管理类期刊是科技管理研究的重要学术载体,是知识创新和传播、科技成果转化为生产力的重要纽带,对于反映当前及今后一段时期内国家科技管理的发展水平,以及提升国家的科技创新能力具有重要的指导意义[1]。在当前科技管理类期刊蓬勃发展的今天,国内科技管理期刊论文的影响力究竟如何?具体而言,这些期刊论文的被引频次情况是怎样的?进一步地,影响科技管理期刊论文被引频次的决定性因素有哪些?基于此,本研究在分析国内外论文引用影响因素的基础上,以5本国内科技管理高被引核心期刊2012年刊载的1141篇研究论文作为分析样本,实证检验科技管理核心期刊论文被引频次的影响因素,旨在帮助学者明确如何扩大其学术论文的影响力和公信力,有利于科研机构制定合适的科研奖励和认定政策,同时也为期刊出版社组稿、编辑等业务流程的决策提供科学参考。 2 文献回顾与研究假设
2.1 论文被引频次及其影响因素
基于被引频次的引文分析概念最早是由格罗斯(Gross)等人于1927年提出,最初作为评价科学研究重要性的一项重要指标,之后与同行评议(Peer review)一起作为衡量论著影响力的重要指标[2]。论文的引用作为一项复杂的行为,受到诸多客观因素甚至偶然因素的影响(武夷山,2009)[3]。1962年加菲尔德(Garfield)提出了论文被引用的15种动机,1965年洛佩兹(Lipetz)将引用行为进行分类,揭开了引用行为研究的序幕,但二者皆从理论方面进行探讨,缺少相关的实证证据,直到2008年伯恩曼(Lutz Bornmann)和丹尼尔(Hans Daniel)以实证研究阐述科学家引用某篇文章的原因[4]。
目前国内外学者对论文被引频次的影响因素展开了一系列研究。国外近期研究成果中,维埃拉(Vieira)和戈麦斯(Gomes,2010)的研究发现,合作者数量、作者机构数量、文章篇幅/页数、参考文献数量、期刊影响因子等会直接影响论文的引用[5],王(Wang,2012)阐释了第一作者研究水平和论文质量是影响论文被引频次的决定性因素[6],特吕茨勒(Thelw,2013)等强调期刊的影响因子、参考文献平均被引数量对论文被引频次影响最大[7],乔伊斯(Joyce,2014)的研究表明文章特征(研究主题、来源期刊、作者机构因素)等对论文被引频次的影响最显著[8]。与国外研究结论类似,国内一些学者近期的相关研究,也发现了参考文献(姜磊等,2015)、科研合作(苏芳荔,2011)、开放存取论文下载(牛昱昕等,2012)、引用习惯(杨立军等,2012)、内容质量(孙书军等,2010)、论文下载频次与期刊影响因子(张小强,2011)、期刊载文数量(王群英等,2012)等因素会对论文被引频次产生不同程度的影响。
目前的研究多从单一方面探讨与论文被引频次的关系,缺乏系统整合与梳理,国内缺少相关的实证研究,对于科技管理领域期刊论文被引频次的研究目前还未出现。
2.2 研究假设的提出
2.2.1 作者特征与被引频次
通常情况下,研究人员非常关心自己的研究成果被国内外同行认可,如果一项成果在发表后一直无人问津,那么对于科研人员和科学进步而言,很难谈及它的意义[9]。为此科研人员会通过增加作者数量,与高知名度机构、作者合作等方式来提高论文发表后的影响力。加兹尼(Gazni)(2011)等通过对2000—2009年哈佛大学发表的124937篇论文进行分析,结果发现作者数量与论文被引次数之间呈显著正相关[10]。苏芳荔(2011)以图情类影响力最大的4种期刊在2000—2009年的载文量与被引频次作为分析样本,采用符号检验法验证了合作发表论文影响力要明显高于独立(无合作)发表的论文[11]。乔伊斯(Joyce,2014)以1945—2013年Web of Science烧伤科被引频次最高的100篇论文作为分析样本,结果发现论文作者所在机构是影响论文影响力的重要特征之一。上述研究发现所得出的结论都与作者特征密切相关。在此,本研究提出假设1:
H1:作者特征与论文被引频次显著正相关,即:作者机构越有名,合作人数越多,则论文被引频次越高。
此外,现有研究在考虑作者特征方面忽略了性别因素,而高校科研院所中女性研究人员也占了一定的比例,在此本研究将性别因素纳入作者特征中进行分析。
2.2.2 论文特征与被引频次
尽管学术质量决定论文的被引频次,但除了论文质量以外,论文自身的其他特征,如参考文献数量和长度、论文研究方法、资助基金数量、下载频次等也会对论文被引频次产生影响。孙书军等(2010)通过对两篇发表在国内期刊的高被引论文分析,认为论文的被引频次决定于论文的内容质量。简琳等(2011)通过对6个学科的455篇论文被引的文本因素进行分析,结果发现文献长度、参考文献数量对论文被引频次的影响在不同学科间存在着显著差异[12]。张小强(2011)、丁佐奇等(2011)、牛昱昕等(2012)分别以中国知网、中国知网CSCD与CHSSCD,以及中国科技论文在线等数据库刊载的论文作为分析样本,结果都表明论文下载频次与论文被引情况显著正相关[13-15]。库卡尼(kulkarni)(2007)等以JCR影响因子最高的三种医学期刊刊登的多篇研究论文为样本,结果发现有产业资助支持的论文在发表后的被引用次数更多[16]。韦斯特(West)和麦尔维尼(Mellwaine)(2002)的研究结果表明文章所研究的物质类型和方法与论文引用次数无关,但是莫希特(Mohit,2007)的研究结论确认为相对于实验设计不严格的临床文章而言,涉及到方法保障的基础科学、临床文章会被引用的更多,并且这些文章都有充分的数据支撑和论证[17-18]。基于上述研究结论,在此提出假设2:
H2:论文特征与论文被引频次显著正相关,即:论文受到资助的基金数量越多,论文下载频次越多,论文越偏向于定量研究,则论文的被引频次越高。
3 研究设计
3.1 研究样本与数据来源
本研究选取国内科技管理研究领域的5本高被引期刊作为研究对象,它们分别是:《科学学研究》《科研管理》《科学学与科学技术管理》《中国科技论坛》《研究与发展管理》。这5本期刊在国内学界拥有良好的口碑,办刊时间迄今已有30多年,都被CSSCI数据库和北大核心期刊数据库所收录,影响因子较高,并且除《中国科技论坛》外,其他4本期刊都是国家自然科学基金委(NSFC)管理学部认定的A/B类重要期刊(见下表1)。本文采用的数据来源于这5本期刊在2012年度发表的1141篇研究论文,这些论文都可以在中国知网(CNKI)上轻松获取。之所以选择2012年刊载的文献是因为,根据普赖斯定律,文献一般在其发表2年后才开始达到引用峰值。另外,本研究的数据采集时间是2015年7月20日—7月26日。 3.2 变量识别与测量
本研究将论文被引频次作为因变量,作者特征和论文特征作为自变量。其中,作者特征包含第一作者所在机构、第一作者性别、作者是否合作三个维度,同时,论文特征包含论文是否定量研究、论文受到基金资助数量以及论文下载频次三个维度。将期刊特征作为控制变量,具体包含期刊全年发文量、期刊主办方与期刊影响因子等三个方面。有关研究变量的名称、代码及测量等信息如表2所示。
3.3 工具与方法
在社会科学研究中,有时因变量常常是计数类型的变量,诸如犯罪次数、人口迁移次数、看病次数等,它们都是某种事件发生数,取值为0、1、2、3……离散的非负整数。计数变量的标准模型为泊松分布,也就是说泊松回归模型(Poisson Regression Model)是建立在泊松分布基础上的回归模型(Cameron等,1998),它构成了对计数变量进行多元量化分析的起点。泊松回归除了可以接受虚拟编码方式的年龄、性别、机构等分类自变量外,还可以直接接受连续型自变量,因此本研究适宜采用泊松回归探讨解释变量与被解释变量之间的关系[19]。对于个体i,记被解释变量为Yi,假设Yi=yi的概率由参数为λi的泊松分布所决定,在此,本研究构建泊松回归模型如公式(1)所示:
(1)
在公式(1)中:λi为泊松到达率(Poisson arrival rate),表示事件发生的平均次数,由解释变量xi所决定。泊松分布的期望与方差等于泊松到达率λi,λi也可称之为发生率比(Incidence Rate Ratio,简称IRR),它表示当解释变量xi增加微小量时,事件的平均发生次数将增加多少百分点。本研究拟采用STATA 12.0软件进行泊松回归分析。
4 结果分析
4.1 论文被引频次状况的整体比较
图1描绘了5本高被引期刊按出版期数进行分类汇总的论文均篇被引频次分布情况。从总体上看,除《中国科技论坛》外,其他4本期刊论文的被引频次都呈现出较强的时间依赖性(尤其是《科研管理》和《研究与发展管理》),发表在年初的文献,其被引频次要比发表在年中和年末文献的被引频次高。5本期刊中,《科研管理》刊载的论文被引频次最高,体现该刊在国内已经具有较强的影响力;《科学学研究》期刊论文的被引频次相对《科研管理》要稍显逊色。5本期刊每期刊载文献的均篇被引频次的差异性明显,波动性较大,最高达到14.3左右,最低只有3.3左右,这可能是由于论文研究主题的“冷热”等因素造成。总之,尽管5本期刊刊载的论文其被引频次与刊载时间之间存在着一定的依赖性,但是图1中的变化趋势同时反映了论文刊载时间与被引频次之间存在着非线性相关性。
4.2 描述性分析
表3报告了变量的描述性统计分析结果,从中可以看出所有论文的均篇被引频次仅为7.8279,这说明目前论文被引频次整体程度不高。由于发表时间较短,某些有潜力在未来成为高被引的文章可能被忽略,需要再等待一段时间文献的价值才会得以体现。此外,作者特征自变量的均值表明第一作者所在机构大多来自国内“211”和“985”重点院校,男性作者数量要多于女性作者,合作论文数量要略多于独作论文的数量。更进一步地,论文特征自变量均值反映出目前定量研究论文数量要明显多于定性研究论文数量,均篇论文受到1.8个左右基金项目的资助,论文下载频次之间的差距非常大。最后,期刊特征控制变量反映出期刊影响因子较高,平均在2分以上,主办方大多是几家机构联合办刊,年度发文总量之间的差距也比较大。另外,所有研究变量的VIF值均小于10,尤其是自变量的VIF值都保持在1左右,这表明当前变量之间不存在多重共线问题,数据可以直接进行回归分析。
4.3 泊松回归分析
表4报告了论文被引频次影响因素的泊松回归模型分析结果,其中模型1反映了期刊特征控制变量对论文被引频次的影响,模型2是在控制期刊特征的前提下,作者特征对论文被引频次的影响,模型3是在控制期刊特征的前提下,论文特征对论文被引频次的影响,模型2和模型3是为了比较作者特征和论文特征哪个对论文被引频次的影响更显著,模型4是作者特征、论文特征以及期刊特征对论文被引频次影响的全回归模型,目的为了验证前文提出的研究假设。
模型1的回归分析结果显示,期刊年发文量、期刊影响因子与论文被引频次均呈现出显著相关性,且通过5%的统计显著性水平检验,期刊主办方的影响作用不显著。具体而言,期刊年发文量与论文被引频次之间显著负相关,即在控制其他变量的条件下,年发文量越多的期刊其论文平均被引频次反而比年发文量少的期刊低9%左右,这表明论文被引频次更多取决于期刊的质量而并非仅仅依靠期刊刊载论文数量的多少。此外,影响因子与论文被引频次之间显著正相关,表明了在给定其他变量的条件下,影响因子越高的期刊其论文平均被引频次比影响因子低的期刊高93.02%,这也说明了影响因子高的期刊其论文质量也相对较高,受到学界关注度会更大一些,论文被引频次自然也会具有一定优势。
模型2是控制了期刊特征以后,作者特征对论文被引频次的影响。与模型1相比,在加入作者特征自变量以后,期刊特征对论文被引频次的影响有些削弱,但仍然显著。在作者特征变量中,除了作者是否合作变量在10%的显著性水平下与论文被引频次之间存在正相关性以外,作者特征的其他两个变量与论文被引频次之间均不存在显著相关性。在给定其他变量的前提下,作者之间合作发表的论文其论文平均被引频次要比独作发表的论文高出0.27%,这有可能是因为一方面合作的论文作者之间都有明确分工,而且彼此间会进行交流和探讨,论文本身质量会相对高一些。此外,尽管作者机构与作者性别对论文被引频次影响不显著,但是从中也可以反映作者机构、作者性别与论文被引频次之间的负相关性,即重点高校作者的论文被引频次不一定高于非重点高校作者,男性作者的论文被引频次不一定高于女性作者。 模型3是控制了期刊特征后,论文特征对论文被引频次的影响。结果显示出论文特征对期刊特征的影响有明显削弱的趋势,通过与模型2进行比较,论文特征比作者特征对论文被引频次的影响作用更为显著(R2分别为4.12%,30.05%)。在论文特征三个变量中,论文是否是定量研究、论文下载频次均对论文被引频次产生较强的正向影响(分别在5%和1%水平下显著)。具体而言,如果论文是定量研究的话,其论文平均被引频次比非定量研究论文的被引频次高28.8%,这主要是因为作为目前的主流研究范式,通常而言,定量研究论文格式和研究过程比较规范,并且都有理论基础和文献综述研究,因此其被引频次会相对高一些。而对于论文下载次数而言,在给定其他变量的条件下,论文下载次数越高的期刊,其论文平均被引频次比下载次数越低的论文高出3.2%左右。此外,基金资助数量与论文被引频次之间不存在显著相关性,也就是说论文被引频次并不取决于论文所挂基金数量。
模型4是加入所有变量之后的全回归模型,结果与模型1、模型2和模型3相比,发生了较明显的变化。首先,期刊特征变量中,期刊年发文量与论文被引频次之间的负相关性有所增强,而期刊影响因子与论文被引频次之间的正相关性有所减弱,这主要是由于添加作者特征与论文特征变量后导致期刊特征变量的显著性发生了明显变化。其次,在作者特征变量中,第一作者所在机构、性别与论文被引频次之间仍然不存在显著相关性,作者是否合作在10%的显著性水平下与论文被引频次之间存在正相关性,并且较之模型2而言,相关性有所增强,至此假设1得到了部分支持,即仅有论文是否合作与论文被引频次之间存在显著正相关的假设得到了验证,论文越偏向于合作研究,其被引频次也就越高。再次,在论文特征变量中,除了基金资助数量影响作用不显著以外,论文是否定量研究、论文下载次数均与论文被引频次之间呈现显著正相关关系,并且在5%和1%的显著性水平下得到验证,至此假设2得到了部分支持,即论文越偏向定量研究,论文被下载的次数越多,则论文被引频次就越高。总的来说,论文特征比作者特征对论文被引频次的影响作用更显著,这表明对作者而言,要想提高论文被引频次,应该从论文特征出发,努力提高论文质量,保证论文有充分的数据支撑,与此同时可以考虑与高水平机构、学者等进行合作,以此来提高论文的学术影响力和引用频次。
5 结 语
本研究的主要结论包括:首先,5本高被引核心期刊按出版期数进行分类汇总的论文均篇被引频次分布特征表明,尽管刊载的论文被引频次对时间具有较强的依赖性,但与此同时,论文被引频次与论文刊载时间之间也存在着非线性相关性。其次,描述性统计分析的结果反映出当前论文被引频次整体程度不高,第一作者大多来自国内重点院校,男性作者居多,合作论文数量占主导地位,并且定量研究论文数量明显多于定性研究论文,均篇论文受到1.8个左右基金项目资助,论文下载频次之间差距甚大。再次,泊松回归结果表明作者是否合作、论文是否定量研究、论文下载频次、期刊影响因子与论文被引频次之间显著正相关,而期刊年发文量与论文被引频次之间显著负相关,研究假设1和假设2得到了部分支持。与此同时,泊松回归结果也表明论文特征比作者特征对论文被引频次的影响作用更显著。
本研究的启示在于:首先,论文特征等因素比作者特征等因素对论文被引频次而言更重要,所以要想提高论文的影响力应该首先从论文质量内容、数据等入手,同时可以考虑和一些机构及学者进行合作产出高质量论文。其次,并非论文所在的基金项目数越多越好,基金项目数量对论文被引频次影响不显著,更进一步地,第一作者性别与所在机构对论文被引频次的影响也不显著,这也就说明即使第一作者的机构不是著名高校和科研院所,但在论文质量较高的情况下,学术关注度也会得到增加,而且在性别上也不存在差异。再次,期刊编辑部应该严把论文质量关,控制每期刊载的论文数量,在提升期刊论文质量的同时,提高论文的被引频次,逐渐扩大期刊的学界影响力。本研究的缺陷和不足主要表现在所选取的研究期刊较少,研究结论可能缺乏较广泛的普适性,另外,对于影响因素的总结目前仅局限于作者特征和论文特征两个层面,今后有必要选取更大样本,从多学科比较的视角,系统梳理和验证论文被引频次的影响因素。
注 释
[1]许静.关于科技管理期刊内容趋同的思考[J].编辑学报,2014(4):347-349
[2]Gross P. L. K., Gross E.M.. College Libraries and Chemical Education [J]. Science, 1927(66):385-389.
[3]武夷山.文献引用的可控与不可控[J]. 科技导报,2008(4):99
[4]鲍玉芳,马建霞.科学论文被引频次预测的现状分析与研究[J].情报杂志,2015(5):66-71
[5]Vieira E.S., Gomes J.A.N.F.. Citations to Scientific Articles: Its Distribution and Dependence on the Article Features[J]. Journal of Informetrics, 2010(1): 1-13
[6]Wang M., Yu G., An S., et al. Discovery of Factors Influencing Citation Impact Based on A Soft Fuzzy Rough Set Model[J]. Scientometrics, 2012 (3): 635-644
[7]Didegah F., Thelwall M., Which Factors Help Authors Produce the Highest Impact Research? Collaboration, Journal and Document Properties[J]. Journal of Informetrics, 2013(4): 861-873 [8]Joyce C.W., Kelly J.C., Sugrue C.. A Bibliometric Analysis of the 100 Most Influential Papers In Burns[J]. Burns, 2014(1): 30
[9]孙书军,朱全娥.内容质量决定论文的被引频次[J].编辑学报,2010(2):141-142
[10]Gazni A., Didegah F.. Investigating Different Types of Research Collaboration and Citation Impact: A Case Study of Harvard University’s Publications[J]. Scientometrics, 2011(2): 251-265
[11]苏芳荔.科研合作对期刊论文被引频次的影响[J].图书情报工作,2011(10):144-148
[12]简琳,何静,周剑.论文被引的文本因素分析:多学科视角[J].图书情报工作,2011(20):32-35
[13]张小强.期刊下载频次与被引频次及影响因子相关性:以中国知网CSCD与CHSSCD刊物为样本的计量分析[J].情报理论与实践,2011,(8):36-40
[14]丁佐奇,郑晓南,吴晓明.科技论文被引频次与下载频次的相关性分析[J].中国科技期刊研究,2010(4):467-470
[15]牛昱昕,宗乾进,袁勤俭.开放存取论文下载与引用情况计量研究[J].中国图书馆学报,2012(4):119-127
[16]Kulkarni A. V., Busse J. W., Shams I.. Characteristics Associated With Citation Rate of the Medical Literature[J]. Plos One, 2007(5): E403
[17]West R., Mellwaine A.. What Do Citation Counts Count for In the Field of Addiction? An Empirical Evaluation of Citation Counts and Their Link With Peer Ratings of Quality[J]. Addiction, 2002(5): 501-504
[18]Bhandari M., Busse J., Devereaux P.J., et al. Factors Associated With Citation Rates In the Orthopedic Literature[J]. Canadian Journal of Surgery, 2007(2): 119
[19]郭志刚,巫锡炜.泊松回归在生育率研究中的应用[J].中国人口科学,2006(4):2-15
(收稿日期:2015-11-09)