论文部分内容阅读
二分网络是一类特殊的复杂网络,同单模网络相比,二分网络是由两种异质节点构成的,而且只有异质节点间存在某种相互关系.生活中的许多复杂网络都可以表示为二分网络,二分网络能够体现出网络深层结构特点,对网络结构的研究起到非常重要的作用.二分网络社区划分作为信息挖掘的关键途径,越来越受到学者们的关注.目前,单模网络社区划分研究已经相对成熟,但二分网络的研究还处于发展阶段.虽然已经有许多学者,提出了一些二分网络的社区划分方法,但是这些方法依然存在一定的不足.二分网络社区划分仍然需要进一步研究,提出更加精确,能够更好刻画二分网络特征的理论和方法.本文主要通过对二分网络的背景知识、算法现状及相关理论知识的深入分析,针对目前二分网络社区划分存在的精度不高、难以自主划分社区及模块度分辨率限制等问题,提出了两种社区划分方法和一个社区评价指标,在一定程度上解决了现有算法面临的部分问题.(1)针对现有算法存在精度不高的问题,提出了谱聚类交互算法(SPCI).SPCI主要将谱聚类算法,应用到二分网络社区划分中.首先,根据二分网络中节点间的连边情况,构建相似性矩阵;然后,采用谱聚类算法将其中一类节点划分社区;最后,利用交互度指标和最优化模块度指标,实现二分网络的社区划分.通过在人工数据和真实数据上的验证,表明SPCI不仅相对于资源分布矩阵、边集聚系数和联合谱聚类算法拥有更高的精确度,而且还可以较准确地确定社区划分个数.(2)由于二分网络的评价指标模块度存在一定的分辨率限制,本文依据节点在社区中的连边情况,定义了节点的连边密度,构造了社区的平均密度评价指标.经过实例证明,社区的平均密度评价指标能够克服模块度在完全图上的分辨率限制.同时,通过节点的连边密度和最优化社区的平均密度,提出了连边密度传播算法(EDPR).在真实网络和人工网络上验证显示,利用EDPR划分社区后求得的模块度和社区平均密度,都比利用BRIM、边集聚系数和资源分布算法求得的模块度值和社区平均密度高,这表明连边密度传播算法更能够有效的探索二分网络的结构.