基于图挖掘的社交网络可视化研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:yaohaochang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微博等社交网络的快速兴起,社交网络的研究成为了一个热点课题,如何更加充分的利用现代网络工具快速发掘网络中信息是一个重要的方向。基于图挖掘的网络中节点聚类一直以来都是大规模网络数据分析中重要的研究课题之一,众多研究者在网络社区的发现方面已经取得不少研究成果,但仍然存在许多问题有待解决:算法的效率不高、很少关注重叠的社区结构、不能排除噪音干扰等。信息可视化技术的发展为人们理解网络结构数据并进行有效的挖掘提供了很有效的途径,但对于大规模社交网络传统的可视化布局并不能清晰的展示。针对这些问题,本文以Spark为平台,利用图挖掘,对社区网络展开了社区发现及可视化的研究,具体内容如下:(1)设计基于网络边图的社区发现算法及其并行化。针对GN算法不能发现重叠社区和其复杂度较高的问题,将网络图转换为边图,用边图中节点的相似度替代GN算法中的边介数,改进GN算法,并且利用MapReduce模型,对该算法进行并行化处理,提高其执行效率。(2)提出了基于用户影响力的社区发现算法及其并行化方案。针对基于局部模块度的社区发现算法[26]不稳定问题,借鉴PageRank算法思想,研究社交网络中用户影响力,将影响力大的用户作为初始社区节点,使得社区划分结果稳定且更为准确,并研究了基于用户影响力的社区发现算法的并行化方法。(3)设计基于MapReduce的力导向布局算法。分析串行的力导向布局算法,结合Spark内存计算框架,实现了该算法的并行化,加快网络布局。(4)提出了一种基于社区结构的社交网络可视化方法,该方法将社区结构与力导向布局算法进行结合,改进力导向布局算法,在每个社区进行单独布局,最终得到整个网络的布局,使之可以用于规模较大的社交网络可视化布局。本文的创新点:将用户影响力与局部社区发现算法结合,提出基于用户影响力的社区发现算法,避免了局部社区发现算法的不稳定性,提高了其划分社区的准确性。
其他文献
基于P2P(Peer-to-Peer)技术的流媒体直播系统由于具有可扩展服务能力,为构建大规模流媒体传输系统提供了一种低成本的解决方案,是目前互联网上视频直播的主流技术。本文首先
目前出现的交通事故很多时候是由于司机的疲劳驾驶造成的。因此,如何有效监测和防止驾驶员疲劳驾驶,对降低交通事故及人员死亡率,有着十分重要的现实意义。 基于此,本文主要研
P2P(peer-to-peer)技术为网络应用提供了一种新的思想,他打破了传统的C/S方式的网络应用,引入了对等实体的概念。随着Napster、Gnutella这样的基于P2P技术的文件共享软件在Inte
现在流行的TCP,UDP/IP协议虽然已经成为Internet间各种链路层技术和高层应用程序实现互操作的基础,但是他们在适应当前不断发展变化的网络应用方面处境尴尬:往往一个新业务系统
随着信息技术的快速发展,人们对信息的要求越来越高了。档案作为社会政治、经济、文化、艺术等各种社会活动的原始记录有着其特殊的不可替代的重要意义,成为当今社会不可缺少的
近年来,由于计算机技术的快速发展和业务的不断改变,越来越多的系统由于不能适应当前的应用变化而成为遗留系统。因此遗留系统的维护工作,特别是遗留数据库的维护工作量逐渐
随着无线通信技术的发展,各种新的业务相继出现,这些业务在带宽、时延等方面的要求互不相同。为多种业务提供能够满足其QoS要求的服务,同时尽可能地提高网络的利用率,是网络技术
本文针对目前建立P2PVoIP系统所存在的几大关键问题,包括NAT问题,DHT算法问题,资源冗余同步问题,安全问题,路由方式问题,提出了一种解决上述问题的基于DHT算法的P2PVoIP系统。本文
目前,人们的日常生活已经和网络紧密地联系在一起。而由此带来的网络信息安全性问题目益突出。入侵检测系统作为一种积极主动的安全防护技术,已成为一个重要的研究热点。 传
网络管理是网络发展中一个关键技术,是网络可靠、安全、高效运行的保障。但随着网络的发展,规模不断扩大,复杂性不断增加,异构性不断普遍,使得网络管理越来越困难,网络管理技术的发