社会信息网络社区发现算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:baichuan817
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会信息网络普遍存在于现实世界中的许多领域,比如微博网络、电子邮件网络、科学合作网络等等。在现实生活中,这些网络通常以社区的形式组合在一起,社区结构具体表现为一组顶点的集合,在这个顶点集内部连接紧密而顶点集彼此之间连接比较稀疏。作为复杂社会信息网络的一个显著特征,社区结构一方面反映了目标网络个体之间联系的局部性;另一方面,社区结构影响甚至决定着发生在复杂网络上的动态过程。因此,社区结构的研究对阐明复杂信息网络的组织结构及功能具有非常重要的理论和实际意义。本文针对如何度量社区、如何发现社会信息网络中的社区结构的问题,研究了社会网络中许多高效的静态和动态社区发现算法。主要研究成果和创新之处包括:(1)基于对k均值思想以及其他相关算法的研究分析,本文提出了一种针对静态社会信息网络的社区发现算法(命名为KRRW)从社会网络中发现社区结构。KRRW采用一个简单的随机游走模型来减少k均值模型中算法对初始中心节点选择的强烈依赖程度。另外,文中还提出了一种改进的社区好坏评估方式DCD,DCD是基于社区的聚集性(clustering)这一衡量方式进行的改进,这一度量方式综合考虑了社区内及社区之间的连接密度。在一些经典的现实网络数据集上的实验结果证实了KRRW算法能够较其他一些算法获得更高的社区模块度Q,DCD以及准确率AR等衡量指标。(2)本文还针对动态社会信息网络中如何准确地挖掘社区核心顶点、如何定义和量化社区的增量变化等问题展开研究。在这些调查研究的基础上,本论文提出了一种被命名为ICDMC的新颖增量式动态社区检测算法。该算法综合考虑社区结构的历史信息和当前所产生的变化,只将在网络动态演化过程中节点交互连接有改变的节点的社区归属进行更新。在动态Zachary网络以及从DBLP抽象出的数据集上实验表明,新方法能够获得较其他算法更高的社区模块度Q以及准确率AR,在稳定度S方面也有良好的表现,这些结果验证了该算法具有较高的效率和有效性。
其他文献
徐开发分布式计算已经成为计算机科学前沿的研究热点之一.由于并发分布式计算与传统的顺序计算有着本质的不同,以及并发分布式系统固有的复杂性,我们并发分布式计算的本质的
随着多媒体和网络技术的发展及多媒体远程通信需求的出现,多媒体会议通信系统的研究越来越受到瞩目。尤其在ITU 提出H.323协议以来,该协议对分组交换网上开展多媒体会议的支
在现代同步传动控制系统领域中,生产机台电气控制系统的硬件技术集成度越来越高,其主要控制手段为计算机技术。将上位机(工控机)的现场监控和下位机(单片机)的实时控制即微机
近年来,网格的发展日新月异。当网格被用来作为各种大型应用的计算平台时,寻找网格中最佳资源并合理组织这些资源以满足应用需要是困难的。网格资源选择的目的就是要为应用选
随着不断增长的分布式多媒体应用的需求,以及Internet上商业化应用的飞速发展,对网络的服务质量(QoS:Quality of Service)提出了更高的要求,高效的QoS支持变得越来越重要。IE
进入二十一世纪以来,随着互联网的迅速发展,我国网络游戏出版业取得了长足发展,逐渐成为互联网出版业和互联网信息服务业新的增长点。游戏产业已经成长为新兴产业。东北大学网络
Internet规模迅速扩大,但其基于TCP/IP协议的体系结构一直沿用至今,虽然这种结构是非常成功的,但它依旧存在不少缺陷,其中最为突出的问题之一就是其体系结构所依赖的模型使其
随着计算机技术尤其是多媒体技术和互联网技术的蓬勃发展,消费类电子产品、通信设备、电视电影广播、计算机技术正日益紧密地结合起来,计算机与通信、娱乐业融合的趋势不可逆
目前移动通信技术仍在不断发展,新的技术、新的设备、新的业务不断出现,又使得移动通信网的维护和管理变得日趋复杂;而在通信网建设超前,管理网建设滞后的情况下,没有强大而
XML一出现,就在Web服务以及数据库中得到了充分的应用,并且成为各种应用程序中交换和处理数据的重要格式。本文就XML和数据库尤其是Oracle数据库之间进行数据格式互换,以及在C++