基于用户节点相似度的局部社团挖掘算法的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:pigdun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社团结构是复杂网络非常重要的特征之一。表示人与人之间关系的社交网络、因特网、科学家之间合作的引文网络、物种捕食关系的食物链网络等等都是复杂网络的典型代表。近些年,社交网络社团结构的挖掘受到越来越多的人的关注。传统的社团挖掘方法往往关注于整个网络的社团结构,这样带来的问题往往是复杂度较高。随着网络的规模不断的扩大,运用传统的从全局角度出发挖掘社团结构的算法所带来的计算复杂度高的问题越来越突出,成为社团挖掘面临的瓶颈,与此同时对于类似于万维网这样规模巨大并且动态变化的网络,上述方法的可行性和意义有待讨论。基于以上问题,局部社团结构挖掘算法的研究就显得尤为重要。所谓局部社团结构挖掘是从某个点或者与该点关联性比较大的点出发,挖掘出局部社团的结构。在现实世界中,由于存在巨大的社交网络,人们往往更关注局部具有代表性的节点所属的社区。例如通常情况下,大多数人只是关注社交网络中某个他们感兴趣的人所在的社团结构,或者在万维网中某些特别的网站所在的局部社团结构。本文提出一种局部社团挖掘算法,该算法是一种基于用户节点相似度的局部社团挖掘算法,通过对算法进行复杂度分析以及实验对比,可以得到本文算法在保证较高准确度的情况下,同时保证较低的复杂度的结论。本文主要工作和创新点包括以下几方面内容:第一,通过寻找待挖掘节点的局部中心节点,进而从局部中心节点出发进行局部社团挖掘,同时把用户节点相似度作为往社团中添加节点的依据,降低了算法的时间复杂度,时间复杂度降为O (kd2)。第二,算法在降低时间复杂度的同时,依然保持了较高的算法准确性。第三,将算法运用于经典的空手道网络、海豚网络、美式足球俱乐部网络、美国政治书籍网络以及计算机生成的满足复杂网络结构的计算机模拟生成的标准数据集中,并与经典的局部社团挖掘算法进行了对比试验,本算法社团挖掘准确度提高。通过实验证实了该算法在降低复杂度的同时,可以保证较高的准确度。
其他文献
从一个简单问题出发,通过变形拓展、层层推进实现本节教学内容,变式拓展蕴含一定的思维深度。问题解决过程不断渗透化归思想、数形结合思想以及分类讨论思想,以问题变式为主
带钩是我国古代先民服饰文化的一个重要配件,是用于束带或佩系物件的一种用具。器形虽小,但它在我国古代文化史上却占有一定的地位。巴族是我国历史上一个重要的民族。考古出土的战国秦汉时期巴族的带钩,是巴文化的有机组成。出土带钩的考古学文化内涵可以反映当时人们的生产生活,通过探究带钩形制装饰等方面的变化,可以看到文化传播的路径。以带钩的视角能很好的探讨不同地区之间的文化互动关系。从战国秦汉时期巴族地区出土的
续写,即接着所给出的文字材料继续写作。一般包括给出开头型,给出部分正文型和给出全部正文型。当然,所应续写的部分也便以此类推,即续写出正文,续写出部分正文和结尾,续写出结尾等
当今时代,市场的竞争越来越激烈。其中,人的因素已经越来越多的成为了组织实现自己战略目标的关键因素,绝大多数企业开始了“抢人”大战。中小型企业如何在如此激烈的市场竞争中吸引人才、留住人才和激励人才,是现代企业人力资源管理中最为关键的问题。与此同时,中小型企业的经营能力和管理模式也受到来自各方越来越多的挑战,不仅要在生产服务技术上有所创新和突破,同时薪酬体系设计和绩效管理上还要科学、合理;因此完善的薪
近年来,随着相关并购政策的放松和自身战略发展的需要,越来越多的上市公司通过并购重组迅速成长起来。随着并购活动的不断增多,企业总资产中商誉的比重也越来大,而大部分被并购企业所固有的高科技、轻资产特性导致其并购产生的大量商誉背后隐藏着极大的减值风险,并购后企业经营业绩不达预期进而大幅计提商誉减值的现象屡见不鲜,给我国证券市场带来了极大的负面影响。因此,研究上市公司的商誉减值原因及其风险防范具有重要意义
目的:心血管疾病致死率在我国城乡人口总死亡原因中占比居高不下,急性心肌梗死(Acute myocardial infarction,AMI)是心血管疾病中致死、致残率较高的一种心血管疾病,其病理生理机制目前尚不完全明确。长链非编码RNA(Long Noncoding RNA,LncRNA)是一类新型的非编码RNA,此类RNA不参与蛋白质编码,但在增殖、凋亡、迁移、侵袭、分化等多种生物过程中起着重要