论文部分内容阅读
随着网络发展,网上发帖在人们日常生活中日益普及。根据发帖行为对网民和帖子进行社区划分,对判断网络中的水军和垃圾信息具有重要意义。网民与帖子构成了的二分网络是复杂网络的一种。二分网络社区划分是复杂网络社区划分重要的分支。二分网络社区划分最原始的算法是利用投影法将二分网络映射成单分网络,然后利用比较成熟的单分网络社区划分算法来进行研究。本文第一章节绪论主要介绍了复杂网络的相关知识和当前的研究现状,阐述了复杂网络在日常生活中的应用以及复杂网络的统计描述。第二章介绍了复杂网络及其特性。第三章详细地介绍了PageRank算法、随机游走的思想以及马尔可夫链。第四章介绍了基于PageRank算法的二分网络社区划分算法以及该算法在经典网络中进行实验得出的结论。并在最后介绍了社区划分的评价准则—模块度Q函数。最后一章是总结和展望,对本文的算法进行了总结,对社区划分进行了展望。基于信息在网络中的PageRank算法和模块度思想,本文提出了一个针对二分网络单侧节点的社区划分聚类算法。该算法通过模拟信息在网络中扩散的过程,利用各个节点的信息量在网络中扩散后,每个节点收到其他节点的信息量作为社区之间合并的依据,并引入模块度作为社区划分优劣判断的依据。该算法首先将二分网络转化为转移概率矩阵的形式,然后利用二分网络中单侧节点的关系进行概率转移,这样会得到单侧节点的概率转移关系,利用这个关系可以进行二分网络社区划分。最后算法在典型网络上测试结果表明,该算法能够获得比较高质量的社区划分效果。