基于集成学习的社区成员识别技术研究

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:Seanecn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中,许多系统都可以建模成相应的复杂网络,进而分析,如微博网络、蛋白质网络、文献网络等。这些网络通常以模块(又称社区)构成,模块内部的连通性较好,模块之间则较低。社区发现是复杂网络分析的一个重要问题,对发现网络中节点之间的隐藏关系,挖掘网络信息有着重要理论意义和实用价值。传统基于种子集的社区发现算法仅构造单一识别模型,无法有效识别社区成员。针对该问题,本文研究基于多模型集成学习和种子集扩展的社区发现算法,提高未知成员识别准确率。论文主要研究内容和结论如下:(1)基于重要种子成员扩展和装袋自助采样集成学习的社区发现算法针对已有基于种子集的社区发现算法中种子节点选择不合理和单一算法模型未能从多方面考虑种子信息的问题,本文提出了一种基于重要种子成员扩展和装袋自助采样集成的算法。首先通过计算节点的度中心性系数得到各个邻接节点的重要性,根据重要成员和已有种子集进行未知成员的识别,然后将改进后的算法作为基分类器,利用装袋(Bagging)自助采样算法获得多个差异性的基分类器,最后结合多个基分类器提高识别准确率。实验结果表明,引入节点度中心性的社区发现算法,识别准确率有较强提高;利用自助采样集成后的算法和传统的社区发现算法相比,识别准确率相较传统基于种子集的社区发现算法有较大提升,而且更适用于稀疏社区的未知成员识别。(2)基于自适应增强集成学习的社区发现算法针对基于自助采样的集成学习尚未考虑节点和社区的所属关系的问题,本文提出了一种基于自适应增强集成学习的社区发现算法。从网络拓扑结构和AdaBoost自适应算法进行研究,将基于种子集的社区发现看作二分类问题,训练数据集分布的改变取决于样本是否被正确分类。首先赋予样本初始权重,然后调低正确分类的样本权重,同时调高分类错误样本权重,最后将多个弱分类器加权组合在一起得到强分类器。实验结果表明,集成后的算法相较于传统基于种子集的社区发现算法,识别效果有较大提升,且在处理稠密社区时有更好的效果。表明基于自适应增强集成学习社区发现算法可以提高识别准确率,为用户提供更有价值的数据。
其他文献
云计算的任务调度和资源分配一直是当前云计算研究的热点。随着大数据和物联网的发展,如何在最短时间内寻找最优结果是云计算调度分配的核心问题。当前各种改进算法仍然是在
伴随着国家经济的发展,地下空间工程大量兴建,在建筑工程深基坑施工过程中,经常需要将地下水位降到一定深度,才能使基坑底部无水,便于施工。如何保证地下工程安全高效施工、
《物权法》第149条住宅建设用地使用权期限届满后自动续期的规则,从学术探讨到舆论热点,从升斗小民到党中央国务院对该问题的关注有增无减。该问题事关所有城市居民的财产权
线位移传感器作为尺寸测量仪器广泛应用于航空航天、军工科研、民生基建等领域,具有响应速度快、量程范围广、测量精度高等特点。目前的检测装置存在效率低、精度差、人为因
及至2005年12月31日,为推进我国资本市场改革,促进企业建立健全激励与约束机制,国务院证券管理委员会发布《上市公司股权激励管理办法(试行)》,此后,越来越多上市公司采用股
强对流天气是指雷暴、闪电、暴雨、冰雹等灾害性天气。冰雹作为一个强对流天气,具有很大的破坏力和强烈的爆发力,这是阿克苏地区的主要灾害性天气,给阿克苏地区的春、夏农业
早期,立法者对商标权的保护建立在商标是一种“财产”这一普遍认识基础之上。现代商标法不仅要保护商标之财产权益,还要保护商标所承载的商誉。为此,商标立法将保护范围扩大
混凝土的耐久性问题受到学者们的广泛关注。微胶囊技术作为一个新兴的自修复技术,为提高混凝土耐久性提供了一种可行的思路。现有文献已经对微胶囊水泥基材料的力学及耐久性
21世纪20年代,经历了三次工业革命后的黄金岁月,科学技术飞速发展,智能产品层出不穷,一些譬如人工智能、虚拟与现实技术、物联网、汽车电子等新科技兴起。高速发展的信息技术
在航天、化工、电力及力学等工程技术领域常存在时间尺度不同的动力系统,控制理论中将这类具有多时标特征的系统抽象成奇异摄动系统来研究。在实际工业中,被控对象和控制器以及传感器执行器的工作状况都将影响其控制性能,而运行过程中元器件的老化和一些意外的发生不可避免。除此之外,伴随着工业系统规模日趋庞大,其控制要求日渐精细复杂,系统中普遍存在的不确定和时滞及外部干扰等因素不容忽视。基于上述原因,本文研究了具有