一种重叠社区发现算法及其在MapReduce上的实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ljyxq13571302523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社区结构是复杂网络普遍存在的拓扑特性之一。挖掘网络中存在的社区结构成为近年来复杂网络领域中的热门问题,并取得了一定的研究成果。然而,随着网络的规模和结构日益复杂而庞大,现有的一些社区发现算法已不再适用。同时,复杂网络中可能存在着重叠结构,一些算法没有考虑到这一特点,以致无法发现网络中的重叠部分。为了解决上述问题,本文结合基于信号传播的相似度计算方法和模糊AP(Affinity Propagation)聚类,提出了一种新的可并行化的重叠社区发现算法CDSFAP(Community Detection by Signal-based Fuzzy Affinity Propagation)。首先,对基于信号传播的相似度计算方法进行了改进,提高了算法的计算准确性和处理复杂图结构的能力。接着,向模糊AP聚类中引入模糊熵(fuzzy entropy)理论,使得算法能够根据节点的模糊性,识别出网络图中的重叠节点。最后,借助MapReduce编程模式,将算法迁移到了云平台。通过对比CDSFAP算法与其它算法在多组测试集上的社区划分质量和运行效率,验证了算法的可行性。同时,在处理大规模网络测试集时,算法的MapReduce版本也表现出了较为理想的效果。
其他文献
排水严重改变泥炭地的环境和生态过程,但对泥炭藓孢子萌发力的影响尚不清楚。在长白山地区白江河泥炭地,分别在优势植物为苔藓的近原始地段和优势植物为小灌木的排水地段,钻取泥炭柱芯为试验材料,逐层测试泥炭理化指标,提取泥炭藓孢子并进行萌发试验,统计孢子数量和萌发力;经过泥炭样品年代测定,建立深度年代关系曲线,研究泥炭藓孢子萌发力对排水的响应和机制。结果表明:整个柱芯对比,近原始地段平均孢子数略高于排水地段
依据国家课程思政建设要求,着重分析2000年后国家级出版社出版的五部高校日语写作教材的范文,具体探讨社会主义核心价值观融入高校日语专业写作教材的现状、存在的问题,日语
本文介绍了采用单片机实现对应急泵柴油机组的控制方案的设计并进行了实际应用,该方案同传统的采用PLC进行控制方案相比,具有成本低、效益高,代码保密性好,系统的安全度高等
当前,随着图像处理技术的发展,生活中出现越来越多的伪造图像,并且以彩色图像为主要篡改对象。拼接作为一种主要的篡改手段,用于篡改图像内容,达到混淆、迷惑和欺骗的目的。针对该
随着人类基因组测序和多种生物模式的顺利完成以及DNA微阵列技术的应用,由此产生了大量的基因表达数据,这些数据具有维数高,样本小的特点。如何有效地从大量基因表达数据中挖掘
【摘 要】南京市第十三中学语文学习实验课程基地奉行“让课程惠泽每一个学生的幸福成长”的理念,通过理念构建,使课程建设转型升级;通过要素建设,确保保障有力;面向全体学生,引导确立自主探究的学习方式,使其成为终身学习的路径。  【关键词】高中语文;课程基地;理念构建;要素建设;学习方式  【中图分类号】G637 【文献标识码】A 【文章编号】1005-6009(2015)38-0065-02  【
随着云计算的广泛应用,许多大型网络公司开始研究并部署自己的云平台。而对于用户而言,面对不同域的网站,每次都要进行重复的身份验证,极为不便。如何对基础的云平台进行合理
手语是聋人使用的语言,它是由手势、表情和头部姿态等构成的稳定的表达系统,相对于一般人多种多样的肢体语言来说,手语更加具有规律性。手语识别能帮助健听人更好的理解打手
图的染色问题是图论中一个重要的研宄课题,在理论和工程上都具有良好的应用背景。图的染色问题是NP完全问题,虽然现有的一些经典智能优化算法如遗传算法、神经网络算法、模拟退
慕课在移动互联网环境下已成为大学生的重要学习资源,但是慕课资源的教学效果却不尽如人意.本文从大学生、高校教师及慕课资源等三方面分析了教学效果的影响因素,进而提出转