动态网络中社区发现的研究与实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:ciscohd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,网络分析逐渐成为研究热点。社区发现是网络研究中的重要研究课题,通常社区具有内部节点连接紧密,而社区之间节点连接稀疏的特性。近年来,许多优秀的社区发现算法不断涌现,并广泛应用于许多领域。由于网络规模日益增大,许多算法引入了并行计算。然而这些算法多数为静态算法,无法进行网络演化分析。而动态社区发现算法大多为单机算法,效率低下,难以进行大规模网络的分析。因此将动态算法与并行计算相结合是非常必要的。根据重叠性,社区发现研究可分为非重叠社区发现与重叠社区发现两种,顾名思义,非重叠社区中一个节点只有一个社区归属,重叠社区则允许节点有多个社区归属。基于Spark,本文设计并实现了两种并行动态网络社区发现算法和一个并行图计算系统,主要贡献如下:本文基于现有社区质量衡量指标的局限性,提出一种新的并行指标PWCC来衡量社区质量。该指标对结构变化非常敏感,保证了社区结构的准确性。本文提出一种基于增量计算的并行动态非重叠社区发现算法PICD,其增量聚类过程主要分为两步:首先执行并行的全局搜索发现增量节点,然后仅对增量节点执行并行的局部社区归属调整,充分利用网络短时平滑性特点,通过不断优化网络的PWCC来获取高质量的社区结构。基于PICD发现的社区结构,本文继续提出一种并行动态重叠社区发现算法PIOCD,同样基于PWCC的优化发现网络中高质量的重叠社区结构。PIOCD对节点的社区归属调整策略进行扩展,允许节点复制到其邻居社区,保证了社区结构的重叠性。本文在人工网络和真实网络上进行了大量实验,实验结果表明两种算法具有更高的准确性和稳定性,可以发现更加准确的社区结构,并且实现了更高的效率。在时间性能方面,随着网络规模的增加,算法呈现几乎线性的时间增长。最后,本文设计并实现了一个并行图计算系统,基于Spark实现多种网络指标分析和社区发现算法,并以组件形式集成到系统中,系统支持网络导入、网络指标分析、静态社区发现、动态社区发现以及网络展示等操作,方便用户进行大规模网络的分析与计算。
其他文献
改革开放40年来,我国不断融入全球化进程,在美国逆全球化背景下,我国推动实施“一带一路”战略,坚持对外开放,扩大开放程度,与国际社会、组织深化交流合作,成为全球化推动新引擎。在此进程中,境外非政府组织越来越多地进入我国西南边疆地区开展扶贫开发、环境保护、慈善救助等领域的活动,在为当地带来先进的理念、经验和技术的同时,部分境外非政府组织在当地非法开展政治渗透、宗教传播、情报搜集等危害我国国家安全的行
<正>能给人留下深刻而美好记忆的游历,是难于忘怀的。游览白洋淀已过去了将近一年,而当时观赏的景物仍历历在目。这片湖水荡漾、荷叶碧绿、芦苇茂盛的水乡泽国,在河北省新安
期刊
目的比较并评价超声引导硬化剂注射(UGFS)和传统大隐静脉高位结扎+抽剥术(CS)治疗大隐静脉(GSV)曲张的疗效及安全性。方法检索2003年12月至2013年12月发表的有关比较UGFS和CS
目的探讨不同剂量阿托伐他汀对高血压患者颈动脉硬化斑块的影响。方法选择我院2010年7月—2012年7月收治的高血压患者96例,均经彩色多普勒超声检查确诊有颈动脉硬化斑块,根据
在研究了Buck变换器的纹波变化特征基础上,给出了连续状态下电路主要参数的代数表达式及控制系统的设计技术.通过系统仿真,指出了分岔特性给变换器输出纹波以及控制时间延迟
对于高频无线电信号在海洋的传播与接收问题,本文基于Fresnel反射原理,建立了海洋表面高频无线电信号传播的理论模型。该模型分为两个部分,第一部分研究了在海洋表面海浪的不
聚-β-羟基丁酸酯(poly-β-hydroxybutyrate,以下简称为PHB)是细胞内的一类生物聚酯,是制备“生物可降解塑料”的理想原料。隐藏嗜酸菌株DX1-1(CCTCC M208056)筛自有机质严重缺乏
科学探究既是学习目标,又是重要的学习方式和教学方式,如何对学生的探究水平进行客观正确的评价,一直是我们基础教育工作者努力探索的课题。在实施新课程的近几年中,各地教育部门
文章重点介绍一款5~85 V可调输出开关电源的工作原理,给出了设计过程及参数计算。