论文部分内容阅读
〔摘要〕不同学科之间期刊影响因子的大小有非常大的变化,从相差数倍到相差上百倍。为探讨不同学科之间期刊影响因子有如此大差别的主要原因,使期刊影响因子既能体现学科内期刊的学术质量和影响力,也能较好地反映不同学科期刊之间的学术质量和影响力差别,本研究结合JCR数据从理论上分析了学科内期刊数量对期刊影响因子的影响。研究表明,期刊影响因子的大小随着学科内期刊数量的增加而增加,比较不同学科之间期刊影响因子的大小没有多大意义;对期刊影响因子计算方法提出了改进,改进方法较好地消除了期刊影响因子对学科内期刊数量的强烈依赖关系;改进的影响因子更客观、更有效、更合理,不仅能有效地反映期刊的学术质量和影响力,而且也使不同学科之间期刊的影响因子具有较合理的可比性。
〔关键词〕期刊;影响因子;学术评价;学术重要性
〔中图分类号〕G23 〔文献标识码〕A〔文章编号〕1008-2689(2011)02-0039-05
一、引言
如何评价期刊的学术重要性和影响力?期刊影响因子是其评价的定量和客观的重要指标之一[1~3],已经被广泛使用近半个世纪。一般都认为期刊的影响因子越大期刊的学术质量越高、影响力越大。特别是近些年,期刊影响因子被越来越多地用于研究能力和学术成就的评估[4~5]。然而,用影响因子的大小衡量不同学科之间期刊的学术质量和影响力是很不合理的,因为现有方法计算的影响因子的大小,只能代表同一学科内期刊学术质量的高低和影响力的大小,而不能很好地反映不同学科之间期刊学术质量的好坏和影响力的大小,即不同学科之间期刊影响因子不具有可比性。例如:某些学科顶尖期刊的影响因子常常比其他一些学科一般期刊的影响因子低很多[6~7]。本文研究了学科内期刊数量对期刊影响因子的影响,并提出了改进影响因子及其计算方法,较好地解决了现有影响因子存在的这些不足。
二、分析与讨论
期刊影响因子是以该期刊发表的论文被引用次数为基础的,是美国信息学家尤金•加菲尔德(Eugene Garfield)提出的,他最初提出影响因子的目的是为了《现刊目次,Current Contents》的评估和挑选期刊。期刊影响因子由美国科学情报所从1963年开始出版发布,目前人们所说的影响因子一般是指1975年以后发布的。《期刊引证报告》(Journal Citation Reports, JCR)每年提供上一年度該数据库收录的每种期刊的影响因子[1, 8~9]。对某个特定期刊,它的某年影响因子就是该期刊在该年之前两年发表的论文在该年被引用的平均次数,引用的期刊必须为科学引文索引[Science Citation Index (SCI)]的源期刊[9~10],影响因子的计算公式如下[7~9]:
D = B / C(1)
式中D是某期刊特定年的影响因子;B是该期刊在特定年之前两年发表的论文在该特定年被引用的次数;C是该期刊在特定年之前两年发表的论文总数。
可见,方程(1)中的B不仅与该期刊所发表论文的重要性有关,也与该期刊发表论文数量和该期刊所在学科包含的期刊数量有关。假设每篇论文具有相同的被引用的可能性,那么期刊发表的论文数量越多,期刊论文被引用的次数也会越多;学科内期刊数量越多,论文被引用的机会越多。考虑到发表论文的数量和引用次数之间的关系,将B被C除,即将被引用次数除以论文总数,以便消除论文数量对影响因子的影响,现有计算公式(1)实现了这一点。但是,可以发现在方程(1)中期刊所在学科中包含的期刊数量对影响因子的影响没有被消除,而这一因素强烈影响影响因子的大小,导致不同学科之间期刊影响因子具有巨大差别和不具有可比性。为了解释该因素对影响因子的影响,将方程(1)表示为:
IF(y,2)=(2)
式中IF(y,2)是期刊x在y年的影响因子;C(y)是期刊 x被SCI中期刊j在(y-i)年内引用的次数;m是包含在SCI内并引用期刊x发表的论文的期刊数量;P是期刊x在(y-i)年发表的论文数量。
方程(2)表明,IF(y,2)取决于m、C(y)和P,m 值越大越有利于增大IF(y,2)的值。事实上在不同学科之间的相互引用次数是很少的,主要是学科内期刊之间的相互引用,所以引用某期刊x论文的期刊数量m主要由期刊x所在学科内包含在SCI内的期刊数量(N)决定,即N越大则m也越大。这样由公式(2)可以得出学科内被SCI收录的期刊数量N越大(一般来说学科期刊数量越大,N也越大),则m越大,学科内某期刊的影响因子IF(y,2)也就越大,这一点已被《期刊引证报告》(Journal Citation Report, JCR)所证实。在JCR中每个学科的最高影响因子随学科内期刊数量的增加而增加,例如:根据2002-2004年美国信息情报所的《期刊引证报告》[6],各个学科期刊最高影响因子IFmax与各自学科内期刊数量N之间的关系如图1所示。
图1表明,总体上,学科中期刊最高影响因子IFmax随着学科被SCI收录的期刊数量N的增加而增加。这意味着来源于JCR的影响因子在很大程度上反映的是学科中期刊数量大小的效应,并不能真正衡量期刊的学术质量和影响力。这正是为什么常常期刊数量较多的学科的期刊影响因子较大,而期刊数量较少的学科的期刊影响因子较小的真正原因,两个学科之间期刊数量的差别越大,则期刊影响因子的差别就会越显著。所以根据影响因子的大小来判定期刊学术质量和影响力会使人们产生一种错觉,即对于期刊数量较少的学科,其顶尖期刊学术质量和影响力常常不如期刊数量较大学科的一般期刊。因此,有必要在期刊影响因子的计算中消除学科内期刊数量对影响因子的影响,使影响因子真正反映期刊的学术质量和影响力。为此做如下处理:先将方程(2)被N除,然后为使影响因子便于使用,再将其乘以10,这样方程(2)将成为方程(3)的形式;同时计算影响因子时保留3位小数。
IF(y,2)= (3)
式中IF(y,2)是改进影响因子,其他符号与公式(2)和上文中提到的所代表的意义相同。
作为验证个例子,使用方程(3)对2002-2004年JCR中各学科期刊最高影响因子进行修正,得到改进最高影响因子IFrmax与N之间的关系如图2所示。图2清楚地表明各学科期刊的最高影响因子IFrmax随N的增加没有明显的单调变化趋势,也就是说本文对影响因子提出的改进方法能有效消除学科期刊数量对影响因子的影响。这样获得的改进影响因子是更合理的,更能反映期刊的学术质量和影响力,并使得各学科之间期刊影响因子具有可比性。
表1给出了JCR 2002-2004年每年影响因子排位前3名期刊的影响因子[6]和改进影响因子排位前3名期刊的改进影响因子。可以发现JCR中每年影响因子排位前3名的期刊都出现在期刊数量N较大的学科(N?叟74),但是在对JCR中影响因子进行改进后,改进影响因子排位前3的期刊有的来源于期刊数量N较小的学科(N = 16)。特别是,我们都知道Nature是最著名、学术价值最高、最具影响力的少数期刊之一,但在2002-2004年JCR中每年影响因子排名前3的顶尖期刊中都没有该期刊,这与事实不符;然而,通过对JCR中的影响因子进行改进后,上述3年中每年改进影响因子前3位的期刊中都有Nature出现,这更切合实际。显然改进后的影响因子比改进前更能反映期刊的学术质量和影响力。同时,不同学科之间期刊影响因子的巨大差别也被大大降低,例如:2002-2004年JCR中不同学科之间期刊影响因子最大差值分别达到54.029 (2002年)、51.920 (2003年)和51.720 (2004年) [6],改进后影响因子的最大差值分别降低到7.019 (2002年)、5.674 (2003年) 和 6.988 (2004年)(如表2所示)。因此,对于评价期刊的学术质量和影响力,改进后的影响因子比改进前更有效、更合理。
〔关键词〕期刊;影响因子;学术评价;学术重要性
〔中图分类号〕G23 〔文献标识码〕A〔文章编号〕1008-2689(2011)02-0039-05
一、引言
如何评价期刊的学术重要性和影响力?期刊影响因子是其评价的定量和客观的重要指标之一[1~3],已经被广泛使用近半个世纪。一般都认为期刊的影响因子越大期刊的学术质量越高、影响力越大。特别是近些年,期刊影响因子被越来越多地用于研究能力和学术成就的评估[4~5]。然而,用影响因子的大小衡量不同学科之间期刊的学术质量和影响力是很不合理的,因为现有方法计算的影响因子的大小,只能代表同一学科内期刊学术质量的高低和影响力的大小,而不能很好地反映不同学科之间期刊学术质量的好坏和影响力的大小,即不同学科之间期刊影响因子不具有可比性。例如:某些学科顶尖期刊的影响因子常常比其他一些学科一般期刊的影响因子低很多[6~7]。本文研究了学科内期刊数量对期刊影响因子的影响,并提出了改进影响因子及其计算方法,较好地解决了现有影响因子存在的这些不足。
二、分析与讨论
期刊影响因子是以该期刊发表的论文被引用次数为基础的,是美国信息学家尤金•加菲尔德(Eugene Garfield)提出的,他最初提出影响因子的目的是为了《现刊目次,Current Contents》的评估和挑选期刊。期刊影响因子由美国科学情报所从1963年开始出版发布,目前人们所说的影响因子一般是指1975年以后发布的。《期刊引证报告》(Journal Citation Reports, JCR)每年提供上一年度該数据库收录的每种期刊的影响因子[1, 8~9]。对某个特定期刊,它的某年影响因子就是该期刊在该年之前两年发表的论文在该年被引用的平均次数,引用的期刊必须为科学引文索引[Science Citation Index (SCI)]的源期刊[9~10],影响因子的计算公式如下[7~9]:
D = B / C(1)
式中D是某期刊特定年的影响因子;B是该期刊在特定年之前两年发表的论文在该特定年被引用的次数;C是该期刊在特定年之前两年发表的论文总数。
可见,方程(1)中的B不仅与该期刊所发表论文的重要性有关,也与该期刊发表论文数量和该期刊所在学科包含的期刊数量有关。假设每篇论文具有相同的被引用的可能性,那么期刊发表的论文数量越多,期刊论文被引用的次数也会越多;学科内期刊数量越多,论文被引用的机会越多。考虑到发表论文的数量和引用次数之间的关系,将B被C除,即将被引用次数除以论文总数,以便消除论文数量对影响因子的影响,现有计算公式(1)实现了这一点。但是,可以发现在方程(1)中期刊所在学科中包含的期刊数量对影响因子的影响没有被消除,而这一因素强烈影响影响因子的大小,导致不同学科之间期刊影响因子具有巨大差别和不具有可比性。为了解释该因素对影响因子的影响,将方程(1)表示为:
IF(y,2)=(2)
式中IF(y,2)是期刊x在y年的影响因子;C(y)是期刊 x被SCI中期刊j在(y-i)年内引用的次数;m是包含在SCI内并引用期刊x发表的论文的期刊数量;P是期刊x在(y-i)年发表的论文数量。
方程(2)表明,IF(y,2)取决于m、C(y)和P,m 值越大越有利于增大IF(y,2)的值。事实上在不同学科之间的相互引用次数是很少的,主要是学科内期刊之间的相互引用,所以引用某期刊x论文的期刊数量m主要由期刊x所在学科内包含在SCI内的期刊数量(N)决定,即N越大则m也越大。这样由公式(2)可以得出学科内被SCI收录的期刊数量N越大(一般来说学科期刊数量越大,N也越大),则m越大,学科内某期刊的影响因子IF(y,2)也就越大,这一点已被《期刊引证报告》(Journal Citation Report, JCR)所证实。在JCR中每个学科的最高影响因子随学科内期刊数量的增加而增加,例如:根据2002-2004年美国信息情报所的《期刊引证报告》[6],各个学科期刊最高影响因子IFmax与各自学科内期刊数量N之间的关系如图1所示。
图1表明,总体上,学科中期刊最高影响因子IFmax随着学科被SCI收录的期刊数量N的增加而增加。这意味着来源于JCR的影响因子在很大程度上反映的是学科中期刊数量大小的效应,并不能真正衡量期刊的学术质量和影响力。这正是为什么常常期刊数量较多的学科的期刊影响因子较大,而期刊数量较少的学科的期刊影响因子较小的真正原因,两个学科之间期刊数量的差别越大,则期刊影响因子的差别就会越显著。所以根据影响因子的大小来判定期刊学术质量和影响力会使人们产生一种错觉,即对于期刊数量较少的学科,其顶尖期刊学术质量和影响力常常不如期刊数量较大学科的一般期刊。因此,有必要在期刊影响因子的计算中消除学科内期刊数量对影响因子的影响,使影响因子真正反映期刊的学术质量和影响力。为此做如下处理:先将方程(2)被N除,然后为使影响因子便于使用,再将其乘以10,这样方程(2)将成为方程(3)的形式;同时计算影响因子时保留3位小数。
IF(y,2)= (3)
式中IF(y,2)是改进影响因子,其他符号与公式(2)和上文中提到的所代表的意义相同。
作为验证个例子,使用方程(3)对2002-2004年JCR中各学科期刊最高影响因子进行修正,得到改进最高影响因子IFrmax与N之间的关系如图2所示。图2清楚地表明各学科期刊的最高影响因子IFrmax随N的增加没有明显的单调变化趋势,也就是说本文对影响因子提出的改进方法能有效消除学科期刊数量对影响因子的影响。这样获得的改进影响因子是更合理的,更能反映期刊的学术质量和影响力,并使得各学科之间期刊影响因子具有可比性。
表1给出了JCR 2002-2004年每年影响因子排位前3名期刊的影响因子[6]和改进影响因子排位前3名期刊的改进影响因子。可以发现JCR中每年影响因子排位前3名的期刊都出现在期刊数量N较大的学科(N?叟74),但是在对JCR中影响因子进行改进后,改进影响因子排位前3的期刊有的来源于期刊数量N较小的学科(N = 16)。特别是,我们都知道Nature是最著名、学术价值最高、最具影响力的少数期刊之一,但在2002-2004年JCR中每年影响因子排名前3的顶尖期刊中都没有该期刊,这与事实不符;然而,通过对JCR中的影响因子进行改进后,上述3年中每年改进影响因子前3位的期刊中都有Nature出现,这更切合实际。显然改进后的影响因子比改进前更能反映期刊的学术质量和影响力。同时,不同学科之间期刊影响因子的巨大差别也被大大降低,例如:2002-2004年JCR中不同学科之间期刊影响因子最大差值分别达到54.029 (2002年)、51.920 (2003年)和51.720 (2004年) [6],改进后影响因子的最大差值分别降低到7.019 (2002年)、5.674 (2003年) 和 6.988 (2004年)(如表2所示)。因此,对于评价期刊的学术质量和影响力,改进后的影响因子比改进前更有效、更合理。