社区网络中社团发现机制的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:xm10282008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂网络一般是指节点数量多且节点间交互关系复杂的网络。社区结构是复杂网络的拓扑特点之一,整个网络由若干社区构成,社区内部节点的交互频繁,社区间节点的交互较弱。如何从复杂网络中解构出社区结构,已成为复杂系统研究领域中一大热点。  随着网络规模的逐渐增大,特别是Facebook、Twitter、微博等社交网络的崛起,复杂网络的规模指数上涨,不仅对社区发现算法的计算复杂度提出了苛刻的要求,同时也引入了对算法并行化的要求。在不考虑重叠社区的情况下,虽然目前已经提出了一些线性时间复杂度的算法,但由于这些算法通常采用较为激进的贪婪策略,因此在网络规模较大且稠密的图拓扑中结果并不可靠。在重叠社区发现算法中,现有方案通常需要经过多次计算来获得最佳的社团数,计算开销过大。同时,由于文献中多数社区发现算法均不具备并行能力,无法基于分割后的局部点集实现算法逻辑,这将很难满足复杂网络下海量数据的计算需求。基于此,本文分别针对非重叠社区和重叠社区,提出两个社区发现算法,以满足在大规模网络分析中实现高效并行计算的需求。  本文针对相关程度矩阵的计算,提出了一种基于节点动态阈值调节的优化方式,不仅解决了现有算法收敛速度较慢的问题,同时引入了节点自身特性辅助阈值设置,提升了算法准确性。在权重设计方面,考虑原算法中相关程度矩阵各个组成部分的重要程度不同,进行了有区分度的权重设置,并增加了算法对加权图的支持。  针对非重叠社区,提出了两个社区发现算法:基于关键节点的社区发现算法CKE(Community Detection based on Key Nodes Extracting)和基于谱聚类的社区发现算法SKC(SpectralKMeans Cluster based Detection)。CKE算法为了解决原算法中将连通组成部分作为社区结构导致社区间错误合并的问题,引入了点介数算法辅助筛选出关键节点,利用关键节点在多个社区间起桥梁作用这一特性,将其作为划分社区的分界节点,结合BFS算法实现非重叠社区。通过仿真可以证明,CKE算法能够准确找到关键节点,得到有效的社区划分。SKC算法则是利用了聚类思想,通过谱聚类将相关程度矩阵转换为效用矩阵,以完成社区划分。针对现有算法中K值和初心难以预估的问题,引入Canopy聚类辅助设置。  针对重叠社区,提出了两个社区发现算法:基于点聚集的社区发现算法 CCO(Core-clique Combination Optimization detection algorithm)和基于扩散标记的社区发现算法IMB(Iterative diffusion Markbased on high-Betweennes)。CCO算法以发掘高内聚度的点聚集为核心,通过在其上提取重叠节点完成社区发现。常规的重叠点发现策略通常以聚类密度进行判定,其计算复杂度较高,针对这一问题在CCO算法中提出了简化的解决策略。IMB算法则是通过扩散标记思想实现重叠社区的发现。为了保证不同规模的社区结构均能被提取,IMB算法引入了基准阈值?作为标准,利用其能够度量节点与邻接节点间紧密程度这一特性,实现扩散标记。通过仿真可以看出,在少量的几轮迭代标记后,即可获得较好的重叠社区划分结果。  针对大规模网络分析中实现高效并行计算这一需求,需要为算法建立以节点为中心的并发模型,结合图的分割思想,引入分布式计算框架,才能取得较好的社区划分结果。因此,本文还探讨了如何在 Hadoop上分布式执行上述几种算法,实现社区划分。
其他文献
云计算的出现堪称信息技术领域的一次革命。它使数以亿计的互联网用户获取硬件、软件等资源的方式发生了颠覆性的改变。由于云计算本身是从网格计算、并行计算等计算模式发展
随着移动互联技术的快速发展和WLAN的广泛应用,传统的WLAN技术存在的覆盖盲区以及接入能力不足等问题越来越得到重视,而无线Mesh网络由于其多跳自组织、自配置、覆盖范围广等
自Bennett和Brassard于1984年提出第一个量子密钥分发协议(BB84)协议以来,由于量子密码的无条件安全性,越来越多的人投入到量子通信研究这个领域中来。目前,量子通信的研究重
与因特网规模和技术的飞速发展相比,多级安全网络作为一种专用网络,其发展已经远远落后。因此,在TCP/IP协议族的基础上,利用基于多级安全策略的访问控制技术和IPSec技术的数
二进制LDPC码采用BP(信度传播)算法译码时,在长帧时已显示出接近香农限的性能[12]。但随着帧长的增加,其编码复杂度极大地限制了LDPC码的实际应用。Forney提出通过级联的方式
由于多分辨率方法能够提供不同分辨率的图像信息,从而可把高分辨率的精确性与低分辨率的易分割性这对矛盾统一起来,并且很容易控制目标的尺度,因此多分辨率的处理方法在遥感
近年来,我国水运行业得到了迅速发展,由于我国的水上安全基础设施薄弱、管理尚不规范,超载、抢道、冒雾航行等情况时有发生,从而导致翻船、沉船、撞船等交通事故,造成了巨大
嵌入式图形用户界面是嵌入式设备与使用者之间的对话接口,由于它具有良好的人机交互性能,因此在嵌入式软件系统中得到广泛的应用。随着嵌入式设备在人们日常生活中的使用越来越
在卫星通信终端室内单元项目中,所采用的是MPC8250与Linux2.6.x内核作为基本软硬件平台的嵌入式系统。在硬件选择上,MPC8250所采用的硬件现场保护机制,其中断响应时间与Linux
本文主要研究数字电视地面广播(DTTB)系统的信道估计与均衡技术,对基于训练序列的信道估计算法进行了研究,包括基于PN码相关、PN频域变换、频域判决反馈、门限迭代判决反馈、