非重叠社区发现中近邻传播算法的研究与应用

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:cs8613416
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂社会网络可以抽象为由大量节点和节点之间的联系组成的拓扑结构,其在众多领域中广泛存在。聚类分析作为研究复杂社会网络的重要手段之一,目的在于发现其内部的社区结构,体现其内在属性,更好地对现实生活进行指导。本文主要针对近邻传播算法的执行速率较慢、无监督的缺点,给出其改进算法,并将近邻传播算法运用在增量社区发现中。首先,给出基于近邻传播的快速半监督社区发现算法(FSAP算法)。算法在研究近邻传播算法(AP算法)的基础上,根据因子图模型中信息在节点间的传递规则,通过将相似度值为0的节点对直接划分到不同的簇中而提高时间效率,成为快速近邻传播算法(FAP算法)。同时,结合部分Must-link和Cannot-link的成对约束信息,对相似度矩阵进行调整,在新的相似度矩阵上运行FAP算法。相比原始AP算法和其他算法,FSAP算法不仅具有良好的时间效率,而且可以有效利用先验知识去指导聚类过程,进而提高社区发现的准确率。其次,给出基于近邻传播的增量社区发现算法(IAP算法)。算法在FAP算法的基础上,根据网络动态变化的特点,将增量分为增加边、删除边、增加节点、删除节点四种类型,且给出对应的处理方法。由于算法对网络变化进行局部更新,一段时间之后可能造成算法结果相比于真实的社区结构存在失真,给出最小模块度进行检测。在动态社区发现中,相比静态AP算法对全局网络结构的更新,IAP算法不仅能够有效地降低时间复杂度,且能够保证聚类精度。最后,设计并实现了非重叠社区发现算法的原型系统。该系统可以实现数据录入、算法选择、结果显示、系统设置等功能,能够直观地体现社区发现的结果,在社区发现的研究中发挥了良好的作用。
其他文献
广义L-拓扑空间是由白世忠(S.Z.Bai.Generalized L-topological space[J].Journal of Intelligent and Fuzzy Systems,2015,28:301-309.)于2015年提出的一种弱L-拓扑空间,并
自Michael以函数扩张问题为基础给出连续选择创始性的工作以来,选择理论已成为一般拓扑学中最有趣的课题之一,并在其他数学分支中有广泛的应用.从覆盖性质的角度研究选择问题
在半群代数理论中,理想在研究半群性质和刻画半群内部结构中占据重要地位.类比理想对半群的刻画方式,本文引入Γ-超半群的(m,n)拟超理想、(m,n)超理想等概念,并用它们研究Γ-
Ssa1蛋白是热休克蛋白70 (Heat shock protein 70, Hsp70)家族的重要成员,主要分布在酵母细胞中以分子伴侣形式发挥作用,它能够帮助新合成蛋白质正确折叠,修复错误折叠,并解
中国共产党人信仰问题研究的一项基础性工作,是考察他们关于信仰的表述。在为初心使命奋斗的百年历程中,中国共产党人特别是党的领导人作了多方面的信仰表述:肯定了中国共产
日冕物质抛射(Coronal Mass Ejection, CME)是太阳系内规模最大,程度最剧烈的能量释放过程,这些能量的释放可能对地球产生严重的影响,所以对日冕物质抛射的检测具有非常重要
1931年9月18日,日本驻中国东北地区的关东军突然袭击沈阳,以武力攻击东北军,发动了侵略中国东北的战争。当日,埋伏在北大营围墙外面的日军独立守备队第二大队的步兵在炮兵的
外来植物瘤突苍耳(Xanthium strumarium L.)已成为我国东北地区的恶性入侵植物之一。为明确瘤突苍耳是否能与本地同属近缘种苍耳(Xanthium sibiricum Patrin ex Widder)杂交
本文首先介绍了活动星系核及其子类耀变体的基本性质、分类和光变特性。其次,我们处理了SMA(Submillimeter Array)干涉望远镜对耀变体3C273从2004年3月至2013年5月近十年观测
土地利用现状变更调查是对地类图斑、权属界线、行政区划等变化情况的外业实地调查,内业完成对土地利用现状变更数据的更新,从而生成数据增量包以及统计表,实时更新土地利用