社交网络中重叠社区发现和多关系社区发现方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zhyanhz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网科技的飞速发展,各种社交网站和社交新媒体迅速普及,对社交网络的分析日益受到人们重视。作为社交网络分析的一个重要手段,社区发现近年来一直是一个热门研究领域。传统的社区发现方法大多是非重叠的社区发现,同时也只是针对网络中的单一类型关系进行研究。而现实社交网络的社区结构具有重叠性,一个人可能会属于多个社区。人与人之间也往往存在着多种类型的交流关系,只考虑其中一种关系进行社区发现很可能会因为信息不充分造成发现结果不准确。本文分别对单关系社交网络的重叠社区发现和多关系社交网络的非重叠社区发现做了以下三个方面的工作:1.传统的基于种子扩张的重叠社区发现算法在选取种子节点后直接通过贪婪扩张进行社区发现,其通常不能保证所选种子节点的中心性,同时直接贪婪扩张很可能因首次扩张方向失误造成后续扩张全部出错。本文针对上述两个缺陷,提出了一种新的基于种子节点扩张的重叠社区发现方法OSE。首先,OSE在进行社区发现前引入了随机游走对网络进行预处理来降低网络噪音对社区发现结果准确性的影响。其次结合快速密度峰值聚类计算网络中各节点中心值,并据此进行种子节点选取来确保所选节点的中心性。最后通过计算平均相似度,选取一部分邻节点加入种子节点构成一个中心区域后再进行贪婪扩张,以避免直接贪婪扩张的缺陷。实验结果表明,本方法相对于一些传统的方法,在准确性和抗噪音能力上都有了一定的提升。2.借鉴上述种子扩张思想,本文提出一种基于种子社区扩张的多关系社交网络社区发现方法Multi-SC。Multi-SC首先通过综合网络中各类关系的社区划分信息,选择在所有关系中均处于同一社区的个体组成种子社区集,从中选取包含节点数目最大的社区作为种子社区。之后考虑到网络中两个节点被划分在同一社区的关系数目和公共邻节点间的联系紧密度对二者相似性的影响,对杰卡德相似度函数进行了改进,提出了一个多关系网络中节点相似度计算方法,并以此来计算社区相似度。最后结合改进的相似度函数和一种局部适应度函数完成种子社区的扩张。实验结果表明Multi-SC方法能有效的进行多关系社区发现,并且在中低噪音环境下相对一些现有方法准确率有所提升。3.现有的多关系社交网络社区划分方法大都没有考虑各社交关系之间的差异,在有些社交关系噪音比较大的情况下,会造成综合多种关系进行社区发现反而不如只考虑单个关系的结果准确。针对此问题,本文提出了一种基于多目标进化的多关系社交网络社区发现方法Multi-MOE。方法主要思路是给予各关系不同权重值来反映每个关系在社区划分中的重要性。首先基于模块密度函数D和标准化互信息函数NMI建立目标函数,其次将网络中各种关系的权重作为目标函数的决策变量,通过多目标遗传算法对目标函数进行优化获得各关系的最优权重配比,并据此将多关系网络融合成一个既能有效地综合各种关系社区信息又能同时降低各关系噪音引入的单关系网络,最后通过传统单关系社区发现算法BGLL来对该融合网络进行社区发现。实验表明,相比现有的某些多关系社区发现方法,Multi-MOE提高了社区发现结果的准确性和稳定性。特别是在各关系所含噪音差距比较大的情况下,依然能保持较高的准确性。
其他文献
从创客和创客空间的内涵及创客空间成功的案例出发,分析图书馆与创客空间的关系,进一步说明图书馆创客空间的意义。在“双创”背景下,文章对图书馆发生转型的现象,以及创客空
药物成瘾是一种以不计后果的强迫性用药为特征的慢性复发性脑病,是滥用成瘾性药物而产生的一种依赖状态,撤去药物后出现戒断症状,又称药物依赖,俗称吸毒。药物成瘾不仅严重侵
按照Lamb波理论,板内导波由多阶对称波和反对称波组成。当波长远大于板厚时,利用经典平板理论对Lamb方程进行简化,此时板内主要有零阶对称波S0和反对称波A0两种模态。认识薄
为找出我国乒乓球超级联赛中各俱乐部发展滞缓的原因,本文运用文献资料、问卷调查等研究方法,以各俱乐部的组织管理机制、运行状况以及商业运作等方面为调查对象,对俱乐部的
目的:探讨高血压病患者社区护理干预的效果。方法:在普查某社区3 012人的基础上,对已查出的97例高血压患者随机抽取27例进行社区护理干预,1年后评估干预效果。结果:27例患者
以煤热解废水为研究对象,采用厌氧流化床微生物燃料电池(AFB-MFC)进行生化处理,考察了COD对系统产电及废水处理性能影响,并通过GC/MS内标法分析了反应体系中有机物组成及酚类
目的:探讨槲皮苷是否通过抑制PI3K/AKT信号通路诱导人胃癌SGC7901细胞凋亡。方法:选取SGC7901细胞作为研究对象,采用MTT法检测槲皮苷对SGC7901细胞的毒性作用并测定IC 50值。
随着人工智能的快速发展,各种各样的人工智能算法吸引了越来越多的来自于科学研究和工业应用等方面的注意.人工神经网络是受大脑的功能和结构的启发,构建的人工智能算法,它继
刺槐是一种近代跨洲迁移的豆科植物。刺槐迁移促进了其共生根瘤菌群之间的基因流动,然而宿主迁移对全球范围内刺槐根瘤菌的遗传结构的影响尚未明确。本研究以北美洲、欧洲和
金融业作为我国经济社会的最基础组成部分,在我国的经济社会发展中扮演着越来越重要的作用,金融业发展的好坏,一定程度上影响着全国经济社会的发展趋势和走向。近年来,国家越