基于贪心子图的社会网络节点挖掘算法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:dahaneralpha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据、社会计算等计算机技术的发展,社会网络的研究又向前迈进了一大步。社会网络的规模和复杂程度不断地增大,而现在的计算机也有了这样的能力来计算并分析。企业公司推广产品,需要对口其重点客户;教育机构培训课程,需要寻找其核心听众;政府进行舆论导向,需要针对其信息源头。随着信息量越来越大,当大型社会网络和复杂社会网络出现的时候,能够对网络中的关键节点进行切实有效的挖掘就显得尤为重要了,并且这已然也成为了社会网络研究中重要的组成部分之一。社会网络中的节点挖掘方法主要分为启发类方法和贪心类方法。前者主要是根据社会网络节点自身属性或者网络自身拓扑结构来衡量网络中各个节点的重要程度,如度中心性算法,由于其计算节点的重要性时仅考虑节点的邻居拓扑结构,虽然其计算速度快,但是精确度欠佳;又如接近中心性算法和中介中心性算法,由于其计算时涉及到整个网络拓扑,所以其算法效率很低。而后者则是通过传播模型对于每一个节点进行传播模拟,进而通过其传播范围的大小来计算节点的重要程度,该类算法由于结合了传播模型进行真实传播,算法效率低下,导致了其不适用于大型社会网络。本文针对于启发类方法在节点挖掘效果上不理想及贪心类方法在算法复杂度上极高这两个问题,采取先启发后贪心合并计算的理论,提出了基于贪心子图的社会网络节点挖掘算法。该算法首先依据节点度这个重要属性结合了局部拓扑结构的聚集系数估计出节点的影响潜力,根据影响潜力高低排序并加入种子节点候选集合,同时通过对网络的整体评判排序并选择出特异性阈值最高的节点加入种子节点候选集合。在完成候选集合的选择后,通过改进影响力的线性阈值模型表现为贪心子图策略对于集合中的节点进行真实的传播模拟,选取增量影响范围最大的节点加入到最终节点挖掘结果集合中,并且在每一步传播完成时动态的修正候选集合中的节点,重复候选集合修正过程和传播模拟过程直至达到预期规模的节点挖掘结果集合,最终得到理想的节点挖掘效果。之后,通过分别对比本文提出的算法与启发式算法、贪心类算法等在节点选择效果、算法执行效率、算法传播范围等方面的差异,得出贪心子图节点挖掘算法在保证节点选择效果及效率优于经典算法的基础上还至少能够保证比较高的近似最优解,验证本文提出算法的理论适用性和实际传播效果。
其他文献
随着人类社会进入大数据时代,海量的文本信息充斥着整个互联网,文本地理信息也是如此。如何从这些信息中有效而迅速地抽取价值数据已经成为当今最热门的研究方向之一。然而,
随着IT技术的发展,信息管理系统已经成为现代企业管理的重要工具。然而随着企业的发展,企业管理方式的改变,相应的信息管理系统不能很好的根据企业管理方式的改变而进行很好
乙酸甲酯在对苯二甲酸和聚乙烯醇的生产中常以副产物的形式大量生成,其工业用途有限,通常将乙酸甲酯水解为甲醇和乙酸循环使用。为了改进乙酸甲酯的水解工艺,本文针对乙酸甲酯水解过程中涉及的甲醇-乙酸甲酯的分离问题,以能够将甲醇变为易挥发组分的离子液体为萃取剂,通过萃取精馏对甲醇-乙酸甲酯共沸物进行分离。本文采用片段活度系数(COSMO-SAC)模型对萃取精馏分离甲醇-乙酸甲酯共沸物的离子液体进行筛选,选择
在促进新技术和新商业模式从萌芽到成熟的成长历程中,风险投资具有举足轻重的作用。近年来,国内的风投机构无论是投资总额还是募集资金的规模都增长了数倍。了解风险投资声誉
随着信息技术的发展,磁盘中存储着越来越多的重要数据。近年来,磁盘数据频繁遭受恶意篡改攻击,对计算机和用户造成巨大损失,如引导扇区被恶意写入可使计算机瘫痪;用户的银行
1981年我国进入改革开放时代开始,在加快西部地区经济社会发展的同时,对土地开发利用的需求越来越大。未利用土地资源是经济社会发展的重要资源载体,更是自然生态系统孕育、
随着现代科学技术的日新月异,无线通信技术和信息识别技术越来越被广泛应用到各行各业中。无线射频识别(Radio Frequency Identification,RFID)技术,是近年来发展极其迅速的
随着市场竞争的日益激烈,项目组合成为企业提升自身实力、有效规避风险的不二选择.上下游项目组合是一种重要的组合方式.考虑到组合后项目风险会受到常数支持、时间滞后、交
目的:研究分析高血压患者出生日期及发病日期的运气信息,分析高血压患者出生日期及发病日期的运气信息的特点,寻求高血压发病的运气信息规律。方法:收集来自于山东中医药大学附属医院心内科2013.1.21-2018.1.20收治的4150例第一诊断为“高血压”的全部住院患者,统计所有病人的出生日期及发病日期的运气信息,采用非参数卡方检验,分析发病日期和出生日期不同运气信息对高血压发病的影响。结果:1.在发
随着劳动力成本的日益增长,水果自动分级受到诸多关注,其中苹果自动分级因具有较高的研发难度而难以普及。从分级技术层面来讲,当前苹果外观品质分级的难点主要集中于大小分级与缺陷分级,前者受苹果立体形状多变的影响而难以实现苹果图像直径与实际直径的准确对应,后者受缺陷外观多变且易于与果梗花萼混淆的影响而具有较大的分类难度。从分级系统层面来讲,当前苹果分级多仅限于机械分级,存在与软件结合程度差、检测指标数少以