论文部分内容阅读
近年来,诸如人人网,新浪微博,脸谱网,推特等社会网络在人们的生活中发挥着越来越大的作用,而随着社会网络的蓬勃发展,对于社会网络的研究也越来越受到重视。通过社会网络社团结构的挖掘,能够使用户知晓自己所处的朋友圈,帮助其搭建与老朋友之间沟通的桥梁,同时也筑造了结识新朋友的交友平台。不仅如此,社会网络社团结构的挖掘,还能带来无限商机,比如,媒介能够通过社团轻松获悉自己的潜在受众,从而有的放矢地投放广告。社会网络社团结构的挖掘将方便人们生活、工作的方方面面,有着重大的研究意义。本文对社会网络的社团结构挖掘算法进行探讨与研究。对于社团结构的挖掘,从功能上看主要分成两类,一类是非重叠社团的挖掘,另一类是重叠社团的挖掘。本文基于目前的经典挖掘算法,着眼于社团结构挖掘的效率和质量,提出两个用于非重叠社团结构挖掘的改进算法,并进而提出一个重叠社团结构的挖掘算法。第一个算法是基于先验知识的NJW改进算法,该算法属于图划分算法,通过降维达到提高算法效率的目的,并通过引进孤立程度的概念,从而大大改善了NJW算法无法挖掘孤立社团的问题。第二个算法基于快速GN算法的三段策略层次聚类算法,首先,该算法仍然沿用快速GN算法的凝聚阶段,以使得算法能够自然收敛;其次,该算法通过引入分裂阶断以及阈值,用以在凝聚阶段之前形成初始划分,帮助提高算法效率;最后又通过调整阶段,使得一些不易被凝聚阶段察觉的划分错误得到了纠正。第三个算法结合非重叠社团层次聚类算法中所使用的模块度,并对模块度的概念作了引申,提出社团模块度,节点模块度等概念,进而提出了一种全新的基于模块度的重叠社团挖掘算法。在实验部分,我们将使用模块度,以及标准化互信息量,来比较原有算法与本文算法,体现了本文算法对于社团结构挖掘的准确性,更展现了本文算法对原有算法的改进。对于重叠社团的挖掘,主要通过标准化互信息量,来体现算法有着良好的挖掘质量,从而印证了将模块度引入到重叠社团结构挖掘的可行性。