论文部分内容阅读
随着大数据的广泛应用,论文的使用数据也逐渐进入了信息计量的研究范畴,本文基于数十亿条Frontiers出版的SCI论文的阅读数据作为研究对象,综合统计分析、相关性统计分析、可视化分析等多种技术措施对科学论文的地理扩散特征进行探索。首先,借助SPSS软件对不同国家论文的发表量与阅读量之间的关系进行斯皮尔曼相关性分析,发现论文作者分布地区与读者分布地区之间具有较强的正相关性,即论文发表量越多的地区其阅读量也越多,反之亦然。进一步,选取论文发表数量最多的5个城市作为研究对象对其地理扩散源头、扩散中心和扩散半径进行分析,结果表明,论文的地理扩散源头和地理扩散中心都具有本土化特征,并且论文发表者所在地区、论文的地理扩散源头和论文的地理扩散中心,这三者总体上是一致的;此外,论文在发表短期内,其扩散半径会呈现出由快速到缓慢的变化过程,论文在发表长期内,其扩散半径会达到基本稳定状态。最后,对论文短期和长期内主要读者分布城市进行地域依赖性分析,结果表明,作者所在城市的累计阅读次数在论文发表之后的短期和长期内与其他城市相比,大多都非常的高;而与作者所属国家不一致的这些城市对应的累计阅读次数无论是在短期内还是在长期内都相对较低;此外,与作者所在城市不一致而所属国家相同的城市的累计阅读次数,在短期内相对较高,而在长期内则呈现出相对较低的阅读状况。