基于部分先验知识的社区发现算法研究

来源 :天津科技大学 | 被引量 : 0次 | 上传用户:libingyao2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着DT(Data Technology)时代的到来,数据的价值在各行各业中越来越得到广泛重视。如何从纷繁复杂的数据中发掘去一些有价值的信息来指导和改善我们的工作和生活具有重要的意义。社区发现是复杂网络研究领域一个重要的研究方向,可以从纷繁复杂的网络数据中寻找一些潜在的社区结构,发现隐藏在网络海量数据中的知识和潜藏在一般现象下的规律,进而为人们提供个性化、科学化的服务,帮助人们作出更有效的决策。本文通过对标签传播算法的研究,结合社区发现过程中的先验知识,提出了一种基于局部回路的标签传播社区发现算法,并通过实验对算法进行了验证。本文的研究工作主要包括以下两个方面:(1)提出了一种基于局部回路的标签传播社区发现算法。首先,综述了社区发现算法,并重点分析了标签传播算法及其存在的问题。其次,根据社区发现过程中节点间存在的先验知识,提出了基于局部回路的标签传播改进算法,即标签传播过程中,当存在多个最大标签值时,采用最短局部回路选择策略代替随机选择,从而有效抑制标签在社区间传播,提高算法的准确度,并用简单示例从理论角度验证了算法的可行性。最后,为了验证改进算法的有效性,本文选择了两种类型的数据集,分别采用经典真实数据集、人工生成基准数据集,并以模块度和NMI为评价标准,用对比的方法对本文提出的改进算法进行验证。实验结果表明基于局部回路的标签传播算法可以取得更好的划分效果。(2)实验验证。选取代表性的微博真实网络为实验数据集,通过预处理剔除特殊点,再将改进算法应用到真实的微博网络的划分中,验证改进的算法在真实网络中也能取到较好的划分结果。
其他文献
随着中医药信息化的进一步深入,更广泛的中医药临床数据被规范化整理,形成了大量标准的中医药数据库,使得中医药信息的数据量进一步膨胀,而原有的单机版DartSpora数据挖掘软
按照计算复杂性对计数问题进行分类是理论计算机科学中的一个核心主题。尽管最近几年精确计数领域有很大的进展,对于计数问题的可近似性的研究却一直都很初步,我们仅仅在一些非
人脸识别技术,具有直观、方便、快速、准确以及人机交互友好的特点,一直以来都是模式识别和机器视觉领域一个重要的研究方向。但是,可见光人脸识别在实际的应用过程中,容易受到光
RFID(Radio Frequency Identification)射频识别是一种快速、非接触、实时、低成本的物品识别方式,可以广泛应用于物体识别、跟踪,并能够与广泛的基于语义和逻辑的计算应用集
Mashup是Web2.0时代的一种典型的Web应用,它易在更方便的从多个外部资源站点中获取所需要的信息,并将这些信息有机的整合在一起,从而构建出全新的应用。它具有易用灵活,数据
在数字水印技术高速发展的情况下,数字版权保护的瓶颈体现在如何利用数字水印技术来抑制数字媒体非法扩散,以及如何保护在数字产品交易过程中参与交易的各方的合法利益上,因
国际电信联盟(International Telecommunication Union,ITU)和国际标准化组织(ISO/IEC)制定了一系列视频编码标准最新的视频编码标准H.264,以此改善视频的压缩效率和增强视频
现存的序列模式挖掘算法多是基于瞬时事件的,然而在现实世界中很多事件都是发生在一段时间内,例如语言分析,网络检测等,时间间隔事件序列频繁模式挖掘在这些领域都有很重要的
僵尸网络是攻击者出于恶意目的,传播僵尸程序控制大量主机,并通过一对多的命令与控制信道所组成的网络。传统的僵尸网络主要是基于IRC、HTTP协议的集中式结构,但近年来,越来
智能交通系统(ITS)是智能视频监控系统在现代交通领域的重要应用,代表着未来交通管理的发展趋势。基于视频的车辆检测与定位技术作为ITS的关键技术,处于ITS的底层,是整个系统