论文部分内容阅读
注意力流网络是复杂网络研究领域的一个重要分支,节点相似性是表征复杂网络结构特征和节点属性的关键方法。注意力流网络中的节点相似性研究具有重大理论研究价值和实际应用意义,不仅有助于开展网络社区划分、链路预测等理论研究工作,还可以对网站影响力分析、网站分类与排名等实际应用提供可靠的度量方法。尽管注意力流网络中节点相似性的应用非常广泛,但目前关于注意力流网络中节点相似性的研究课题还较少。本文基于注意力流网络中节点相似性的度量问题提出了两种相似性算法,具体研究内容包括:(1)基于中国互联网信息中心提供的用户上网点击行为日志数据,抽取日志数据中用户上网点击的主站点,生成站点列表,利用网络科学和图论等相关理论构造了注意力流网络。(2)基于对SPA(Spatial Preferred Attachment)模型的优化提出了NID(Nodes Influence Distance)算法度量注意力流网络中的节点相似性。该算法首先通过定义注意力流网络中节点的产生时间_tR,影响半径S_r两项指标对SPA模型进行优化;然后定义一种全新的节点量化形式V _s(7)R _t,S_r(8);其次基于节点的量化形式V_s(7)R _t,S_r(8),利用空间2范数计算节点间的影响距离S_d;最后根据节点间的影响距离S_d度量节点相似性。实验表明:节点的产生时间分布和影响半径分布都是重尾分布;当节点的产生时间早,影响半径大时,该类节点的影响距离小,彼此相似度较高;相同类型节点间的相似度较高。(3)基于相对熵理论提出了RE-NSM(Relative Entropy-Nodes Similarity Matrix)算法度量注意力流网络节点结构相似性。RE-NSM算法共有四步,第一步:把复杂的注意力流网络进行分割,生成若干个局部网络;第二步:基于生成的局部网络,统计节点的结构特征;第三步:将节点的结构特征转化为节点结构信息,由节点结构信息构造节点结构信息概率集合;第四步:通过计算节点结构信息概率集合的相对熵具体量化节点之间的结构相似性。实验表明:大度节点具有吸引力强,存活时间长,用户优先点击概率高等特点;大度节点间的结构相似度较高,与大度节点相似度较低的节点有的已经死亡,该类节点的吸引力很弱,具有惟一性(只被用户点击一次),存活时间较短,被用户点击的概率很低,有的节点只是被一个人或者少数几个人所点击。