基于相似度的社区发现算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:mingtiandetianming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在许多真实的网络中都存在模块或社区。社区的检测是社会网络学习的重要的课题,对于我们了解社会网络的内部关系和结构,进而应用到与社会网络相关的很多领域都有重要的意义。传统的基于相似度的社区发现算法比如GN算法在计算的时候时间复杂度非常高,而基于相似度的社区发现算法的结果主要取决于相似度的选择,有些相似度选择可能使得结果更准确,但是针对规模较大的网络,时间也要是考虑的主要因素之一,所以可以根据网络的不同要求来选择相似度的不同度量方法。目前基于相似度的算法中有两个经典算法,分别是GN算法以及AP算法。GN算法中的时间复杂度非常高,针对这个弱点,可以提出一种基于扩散核特征矩阵相似度的分裂算法和一种基于DSD相似度的分裂算法。这两个算法都是基于网络拓扑结构的算法,避免了GN算法中的计算边介数的时间复杂度高的弱点。实验的结果表示,两个算法的划分效果和GN算法差不多,在效率上有很大的提高,对于相似度的度量方法的研究有一定的价值。Newman贪婪算法是近期社区发现的一个主要算法,拥有准确快速的特点,但是当社区规模过大时,可能会使得社区规模分配不均。在比较基于扩散核特征矩阵的相似度和基于DSD相似度度量方法的优缺点之后,使用DSD相似度度量算法结合Newman贪婪算法(CNM算法),既结合了CNM算法快速准确的优点,而且在一定程度上避免了CNM算法的社区规模分配不均匀的情况。
其他文献
随着市场竞争日益激烈,各行业信息化建设都不断深入,人们或不断构建新的应用系统,或在业务需求的不断变化下改善原有的应用系统,或需要异构不同平台、不同语言的其他系统。而
随着信息技术的飞速发展,信息安全已经成为当今社会越来越关注的问题。密码算法是确保信息安全的核心技术,而密码算法自身的安全性一直以来都是国内外研究学者关注的热点问题。
物联网技术在我国的兴起,给传统制造业带来新的机遇。对于工业缝制行业,借助物联网技术,实时采集生产线中缝制设备和操作工的状态和工作信息,通过无线网络上传到监管中心并及时作
自从互联网开始变革,博客也跟随慢慢崛起,并以惊人的速度发展,到目前为止,博客用户更是达到上千万人。博客已成为人们工作生活必不可少的工具,用户数量的剧增,发表的博客自然也会增
分布式查询处理技术无论在传统分布式数据库环境下还是在数据库网格环境下都是难点问题,而网格环境又具有其特殊性。目前,对网格环境下的查询处理技术的研究和成果较少。本文在
虽然人类基因组计划已经完成并取得了巨大成功,但是遗传疾病致病基因的预测是仍然人类健康领域面临的重大挑战之一。寻找遗传疾病的致病基因在改善医疗护理和理解基因功能等方
拓扑蛋白质组学是蛋白质组学一个崭新的研究方向。MELK技术是拓扑蛋白质组学中的关键技术。多肌炎是自身免疫性结缔组织疾病,特点是肌组织出现炎症导致对称性肌无力和一定程度
传统的机器学习方法假设训练集和测试集来自同一分布的样本集,如果实验数据的分布改变了,需要重新标注新样本作为训练集建立统计模型,然而标注新样本的代价通常很高,采用迁移学习
信息系统安全的紧迫性和网络通信安全的重要性使人们越来越对分组密码的相关理论感兴趣,分组密码的设计与分析也一直是密码学中的热点课题。分组密码作为现代密码学中的一个重
网络钓鱼攻击主要是通过邮件方式传播的,大量的网络钓鱼攻击使得用户遭受到巨大的经济损失。巨额的损失导致用户不信任网上银行和电子商务网站,并严重影响到电子商务的发展。