论文部分内容阅读
随着科学技术与日俱进的发展变化,科研工作不断地深入,科学研究人员已很难独自完成一项课题研究或论文。作为科研成果的主要表现方式,学术文章一般也由多个作者合著发表,一篇文章仅有一名作者的现象很少出现,而且这种合著现象越来越普遍。合著网络是由作者组成的,网络的边表示合著关系,反映了专家学者之间的合著发表文章的情况。对这种网络来进行分析,可以得到很多有关专家学者合著关系的结构方面的信息,比如,一个作者曾经和几个人有过合著,他(她)在这个网络中是否处于中心的位置,哪些作者之间的合著关系比较强,他们在网络中的角色有何不同等。这些信息都从不同的角度反映了专家学者的科研合作情况。可见,合著网络中包含了很多关于专家学者的很有价值的信息,并且这些信息是基于合著发表文章这种合作关系的。如果能较好地挖掘、识别这些信息,并且对这些信息进行深入的分析,将会对科技管理工作和科技政策的制定起到极大的指导作用。本论文将使用复杂网络分析和社会网络分析方法对科学合著网络的网络结构进行探讨,对合著网络分别进行宏观和微观、动态和静态分析。抽取从1995年到2011年之间的16年的会议论文集中的文章作为实验数据集。将相应的合著网络称为数据挖掘合著网络。本文首先是以一些量化的图形理论来度量分析这些在合作网络拓扑结构中质的变化,如密度、直径、和网络最大连通量的相对大小。分析表明,一个领域的发展会经历从相对较小的不连通图到含有巨大连接成分的大型网络的合作结构的拓扑演变。因此,最大分部里的边和节点的数量会经历从相对较少到多的演变。同时在合著网络中,基于合作关系对专家学者进行评价,也就是要分析作者在合著网络中处于什么地位,即分析作者在合著网络中的中心度(重要度)。并通过对经典中心度度量方法进行分析,并在此基础上提出了一种改进的节点中心性的度量指标(c-指标),来度量一个加权合著网中的节点的合作强度。在作者研究方向的分布模式这一方面,本文将其分为作者研究方向的数目,作者研究方向的异质性,作者研究方向的均匀性等三个方向。在提出作者的研究方向的异质性以及作者研究方向的均匀性之后,以数据挖掘学科为例,重点分析了作者学科方向的分布模式以及作者的分类。运用经典的基于节点相似性度量的算法对合著网络做链路预测分析并讨论了弱链接在链路预测中的作用。为了更全面探讨科学合作模式,引用了时间参数,并且定义了相仿组的概念。通过分析,得到一些科学合作中有趣的趋势,包括相仿组的平均大小呈指数增长,而作者的数量呈幂律增加,并且通过外推法能够确定一个独立的相仿组出现的大概日期。同时,运用基于谱分析的方法对网络进行社区划分。本文的这些研究,不但丰富了合著网络研究方面的理论成果,还将为科技管理工作以及科技政策的制定提供有益的借鉴