论文部分内容阅读
20世纪30年代,英国文献学家B.C.Bradford提出了“核心期刊”的概念。60年代,美国文献计量学家E.Garfield也从引文角度证实了核心期刊的存在。随着对核心期刊的讨论,形成了一套基于影响因子的评价体系。在期刊评价中,测度期刊影响力的主要依据有:载文量、下载量、总被引次数、影响因子、引用半衰期等。而目前主要采用的就是影响因子,如:国外的WOS出版的期刊引证报告(JCR)数据库、国内的南京大学出版的中文社科引文数据库(CSSCI)等等。这些著名的期刊引文数据库都是遵循的文献计量学,采用影响因子等对期刊进行评价。现有期刊影响力的评价指标受到了学界广泛的质疑,其原因主要来源于前提假设、计量方法和影响因素。传统的引文分析仅仅只考虑了引用的次数的多少,而忽略了不同的期刊间相互引文所带来的差异。通常都认为一种期刊被引用的次数越多,其期刊的影响力就越大。在实际中,孤立的看待各种期刊之间的引用情况而忽略了科学领域的文献关系,忽略了期刊自身的影响力所带来的影响。特别是对于在核心期刊边缘的期刊,在专家的定性分析中,往往会受到专家所从事的专业领域以及其偏好等因素的影响。因此,本文引入了一种新的算法—PageRank算法对期刊进行排序,该方法不仅仅考虑了期刊之间的相互引用的次数,还考虑了不同期刊之间引用的不同权重,即期刊自身的影响力。本文在第一章介绍了 PageRank算法,主要从该算法提出的背景,及其在链接挖掘分析中的地位。从PageRank算法的简单模型中存在的Rank Sink和Rank Leak异常推到出基于转移概率的PageRank算法模型。利用马尔科夫链证明了 PageRank算法中转移矩阵特征值为1的特征向量的存在性和唯一性,并证明了特征向量和为1的定号性。介绍了求解PageRank算法的幂法。第二章主要介绍了 PageRank算法求解的随机约化算法,提出了随机约化的思想,并进一步对Kaczmarz算法和Randomized Kaczmarz算法进行了阐述及其之间的对比。第三章是对JCR中的统计与概率类的期刊124种期刊利用PageRank算法对其影响力进行排序,使用postman软件对2016年124种期刊之间相互引用的数据,基于随机约化算法改进的PageRank算法得到这124种期刊的影响力。本文得到的结论是:基于PageRank算法得到的期刊影响力排序与影响因子排序存在较大的差异,且PageRank算法对JCR中124种概率与统计类的期刊影响力排序结果与学者的观点一致,使得期刊的影响力排序更加科学和合理。