论文部分内容阅读
随着科学研究的快速发展和学术成果的不断涌现,学术大数据逐渐形成。近年来,学术大数据引起了学者的广泛关注。虽然学者从多个角度对学术大数据展开了科学研究,但是在借助学术大数据进行我国学术产出分布和区域经济发展状况两方面尚处于空白。因此,本文借助学术大数据对学术产出的空间分布和区域经济发展状况进行了研究。在学术产出的空间分布研究中,本文借助了人文地理学上一条很重要的分界线——胡焕庸线;同时利用高校地理位置、论文发表数量、国家自然科学基金资助情况和各高校学者数量这四类数据,对中国学术产出的空间分布进行了研究。研究发现,中国学术产出数据在胡焕庸线两侧的分布比例近似为98:2,与中国人口在胡焕庸线两侧的空间分布比例非常接近。因此,我们认为胡焕庸线可以作为中国学术产出空间分布的分界线。该分界线反映出我国学术产出在空间分布上具有东南强西北弱的规律。在区域经济研究中,首先,从微软学术数据集提取4269431条学术数据,从国家统计局提供的《中国城市统计年鉴》中提取2008至2017年全国地级市的区域经济数据。其次,构建了学者活跃度、学者合作多样性以及区域经济指标;利用Pearson系数和Spearman系数分别对学者活跃度、学者合作多样性与区域经济进行了相关性分析;实验结果显示性别合作多样性与区域经济间的相关性较弱,论文总量、论文引用次数和学者合作地理位置多样性与区域经济间的相关系数均在0.7以上,具有显著相关性。最后,选取与区域经济相关性较强的论文数量等三个维度数据,利用支持向量回归方法来预测区域经济状况,并通过均方根误差和相对误差对实验预测结果进行评估。实验结果表明,不同类型的学术数据对经济预测的均方根误差在0.1左右,可以较好的对区域经济进行预测。依据实验结果,本文给予政府在学术领域相应的决策建议,实现人才辅助的高质量区域经济发展战略。此研究为今后区域经济发展的相关研究开辟了新路径,对传统的经济研究方式进行了补充;对今后宏观经济的决策提供了一定的数据支持;为学术大数据和其他领域与区域经济的关系研究提供了思路。