基于介数的层次聚类社区发现算法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:magic1136
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
真实世界中的许多系统都可以用网络来表示,网络是由结点集和边集构成,在网络系统的研究中,人们把个体视为结点,关系视为边,所组成的群体称为社区。社区结构发现是社会网络分析的一个基本任务,它有助于其他社会计算任务的实现,并且可应用于许多实际问题的求解。社区结构发现是以某种度量方法对数据集中的对象进行相似性划分。在社区发现的算法中,凝聚式聚类算法在度量相似性时没有考虑实际背景下的不可控性,导致划分结果不够精确;分裂式聚类算法往往采用全局信息参数,计算复杂度较高,不适用于大规模网络。鉴于此,本文采用层次聚类的思想,依据点介数和边介数两种信息参数进行社区发现,主要研究工作如下:(1)为了解决实际网络的不可控制性问题,本文提出了传播过程中信号缺失的凝聚式聚类社区发现算法(SMHC)。该算法先将社区结构中的结点看做信号源,考虑点介数在网络中的作用,采用度中心性作为度量结点接收信号概率的方法,量化了结点接收信号过程中的缺失值:通过传递信号将节点间的网络拓扑结构转化为节点的影响向量矩阵,再运用模块度的凝聚式聚类方法进行社区发现。最后,在人工数据集和基准数据集上,通过与已有社区发现算法进行比较,实验结果表明SMHC算法提高了社区划分的准确率。(2)为了降低较大规模网络运行的时间复杂度,本文提出了基于桥和模块度增量结合的分裂式聚类算法(BQI)。该算法用局部信息参数“桥”作为移除边的标准,桥在不同社区的连接中有重要的作用,通过依次去掉桥值最高的边来分裂网络;同时为了减少冗余的步骤,应用模块度增量的方法决定网络在何时停止分裂。最后,在基准数据集上进行验证,并与经典分裂算法GN对比,BQI算法与GN算法的社区划分准确率相当,但BQI算法提高了算法执行速度。
其他文献
随着我国经济的高速发展和城市化建设进程的加快,城市交通日益拥堵,环境污染日益严重。公交优先是解决城市交通拥挤的重要手段,是公共交通系统的一个重要组成部分,它充分体现了“
设备状态故障诊断技术近年来在国内外获得了很大的发展,在保证设备安全、稳定、长周期优质运行方面发挥了很大的作用。随着科学技术的进步与发展,机械设备逐渐趋向于大型化、
铝电解槽作为电解铝工业中最重要的生产设备,也是一个能耗特别高的设备。它运行的是否稳定高效,直接关系到铝的正常生产、经济指标和其使用寿命。如今,电解铝行业正致力于使
计算机断层摄影技术(Computer Tomography,简称CT)广泛应用于医学、工业等领域,如何由测得的二维CT切片图像快速准确地恢复被测物体的三维立体信息,成为了人们关注的焦点,从
伴随着DCS在工业过程控制系统的广泛应用,监控组态软件作为DCS软件系统的重要组成部分得到了飞速发展,已经成为现代计算机控制系统的核心。然而,当前组态软件构建的人机监控
在部队的日常飞行及战备训练中,机场塔台指挥室及时、准确地得到各战斗飞机的相关飞行数据对于任务的完成起着极其重要的作用。由于机堡位置相对分散,需要指派专人到各机堡拷贝
油液监测是监测航空发动机健康状况的重要方法之一。多数航空发动机故障是由零部件异常磨损造成的,异常磨损产生的磨粒较大,由此为实现故障诊断及预警可以对滑油中的大磨粒进
在围绕信息集成系统的研究中,各自治数据源的异构性可以被划分为:平台异构、操作系统异构、数据模型异构、模式异构和由此带来的语义异构等几个不同的层次。其中,语义异构是这
随机共振机制在合适的系统参数和噪声强度条件下,将驱使噪声能量显著转移至弱信号上,改变了噪声不利于弱信号检测的观点。但目前大多数的研究专注于不同非线性系统所表现出的
制造业作为我国生产力发展的核心产业,在计算机技术不断发展的今天,先进的自动化技术、信息化技术使得制造业正不断的向智能化的方向发展。传统的制造企业对车间内设备及工作