论文部分内容阅读
背景:自20世纪初“布拉德福定律”揭示了论文在科学期刊中的分布规律以来,期刊评价理论经历了近一个世纪的漫长发展过程,其脉络大致为:发文量分析—引文数量分析—引文数量与质量结合分析—引文网络分析……目前,引文评价指标在科技期刊评价中起主导作用。其中,影响因子(Impact Factor,IF)被广泛地应用于国内外期刊的引文评价中,但IF存在的局限性导致其在期刊引文评价中的地位备受争议。于是,人们积极探索能取代IF的新指标,具有代表性的指标有:h指数、期刊声望指数(SCImago Journal Rank,SJR)、特征因子(Eigenfactor Score,ES)、篇均来源期刊标准影响(Source Normalized Impact per Paper,SNIP)等,以及围绕这些核心指标衍生出的大量的评价指标。这些衍生指标大部分仅停留于理论研究,只有核心指标被国内外数据库或科研机构广泛应用于期刊及学术评价。然而,不同的数据库选用的指标大不相同,导致得出的评价结果存在分歧,给期刊评价工作带来困惑。因此,大批的文献计量学家试图通过研究这些指标间的特点及相关性,找出评价科技期刊最佳的指标体系,但结论仍是众说纷纭。目的:本研究采用一定的条件筛选出对期刊引文评价的发展和变革起重要推动作用的六大主流指标:IF、IF5(5年影响因子)、h指数、SJR、ES和SNIP,通过对它们的理论分析和实证研究,清晰地掌握这些指标的优缺点,厘清它们之间的关系,并给这些指标赋予不同的权重,消除它们之间的信息重叠,从而将它们组合到一个综合指标中。期望通过这一研究,将国外新的评价指标尽快引入我国期刊引文评价的实践中,突破IF独大的局面,并且能给我国的科技期刊评价工作提供一个新的评价思路和方法。方法:本研究分为两大部分:理论分析和实证研究。理论分析主要通过研究这六大主流指标的计算原理,对比指标的特点,从理论的角度寻找影响这些指标变化的因素;实证研究是通过对Wo S数据库和Scopus数据库共有的1881种医学类期刊的这六大引文指标的2013年的数据进行统计分析,描述数据分布特征(K-S正态性检验),观察指标间的相关性强弱(非参数Spearman相关性分析,Cozby相关等级划分),按指标相关性强弱进行分类(聚类分析),找出这六大指标的公因子、构建指标的综合评价函数(因子分析),并以免疫学专业期刊和内科学综合期刊为实例,计算综合因子值、排序,并与六大评价指标排序结果进行对比分析。结果:从计算原理、来源数据库、引文区间、自引处理等多个角度对比这六大指标,发现它们各自的优缺点,如h指数灵活、稳定,计算简单,但未考虑被引证论文期刊的权重,不适合不同学科领域的期刊对比评价;SJR和ES考虑了引文权重,但SJR与刊载论文的平均水平关系较强,不适合用于跨学科领域期刊比较;ES是对期刊整体影响力的度量,可用于不同学科期刊的对比分析;SNIP最适合不同主题领域期刊之间的评价,但SNIP未考虑引文权重等等。理论分析为进一步大样本实证研究提供了理论依据。实证研究显示,数据皆为右偏态分布;六个指标间均存在统计学上的显著相关性;聚类分析将这六个指标分为两大类:IF、IF5、SNIP、SJR;ES和h指数;因子分析提取了两个公因子,F1在IF、IF5、SNIP、SJR上具有较大载荷,F2在ES和h指数上有较大载荷。结合对这两类指标特点分析的结果,将第一类指标归为平均影响力指标,F1命名为平均影响力因子;第二类指标归为整体影响力指标,F2命名为整体影响力因子。以各指标在因子F1和F2上的得分系数为权重,构建了综合引文评价指标函数。结论:科技期刊评价是多维的、复杂的,统计时段、学科领域、来源数据库的不同都会影响评价结果,无论哪一种指标,在评价科技期刊时都会存在一定的片面性,因此,必须构建综合评价指标体系,这涉及指标的选择、权重的赋予和取消指标间的信息重叠等。本研究通过大样本统计学分析发现,这六大引文评价指标之间的确存在着显著的相关性,而影响它们之间相关性强弱的信息重叠点不在来源数据库、不在引文区间和自引处理、不在是否考虑引文权重等等的不同,而在于计算的指标是反映期刊影响力的平均值还是整体值,载文量起到决定性的作用。该研究构建的综合引文评价指标F,无论在对免疫学专业期刊还是对内科学综合期刊的评价中,综合因子F与F1和F2相比,能明显权衡期刊的整体和平均影响力,消除载文量的影响;与这六大来源指标相比,也能起到很好的代表和平衡作用,排名结果能比较客观地反映期刊的综合影响力。