论文部分内容阅读
科学引文网络是以论文为节点,论文间的引用关系为边所构成的有向图。对它的研究有助于人们分析学术思想的涌现和传播,追踪科研热点,掌握知识脉络,了解最新研究成果。引文网络中引用的产生受被引论文的可读性、重要性以及其涉及话题的新颖性所影响。相同话题是引用产生的前提条件,我们可以将这种话题的“远近”抽象为一种几何距离,故本文将几何图应用到引文网络的研究中,由于论文引用关系可视为一种因果关系,故在2+1维闵氏空间中的一簇同心圆上建立几何图,主要完成了以下工作:(1)将节点(表示论文)随机均匀地撒在这些圆上,赋予每一个节点一个几何区域(表示论文的学术影响力)。新节点连接旧节点当且仅当新节点位于旧节点的影响区域内,以此建立了一种影响力机制。此外,又考虑了论文之间的跨学科引用,建立了一种跨学科引用机制。基于这两种机制,建立了一个几何图模型。模型刻画了引文网络入度分布前端的广义泊松性质以及尾部的无标度性质。此外,该模型还成功地重现了真实引文网络出度分布尾部的特性,以及其它一些引文网络的统计特性,如聚类系数,出度与入度的同配性,巨片以及清晰的社区结构等。以上结果验证了影响力机制和跨学科引用机制的合理性。(2)从Web of Science上采集了PNAS、Nature等杂志的引文数据,并研究这些数据的一些统计特性,如入度分布、聚类系数,发现这些统计特性关于时间是自相似的。我们将入度分布的自相似性的原因解释为:热点话题的涌现以及论文被引用次数只在发表的前几年快速增长现象。综合考虑这两点,在影响力机制的基础上,建立了一个几何图模型。模型中节点的影响区域大小服从相同的幂律分布且随着时间老化。模型成功地重现了真实引文网络入度分布关于时间的周期性。模拟的网络中的节点被引用次数只在生成的前期快速增长。此外,该模型还预测了节点的聚类系数关于时间的自相似性。以上结果验证了该几何图模型的演化机制的合理性。