基于深度学习的社区发现方法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:xqdd520cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社区发现是复杂网络分析中的一项关键任务,它有助于理解以复杂网络为代表的系统的特性,且对实际应用具有重要的意义。复杂的网络结构由节点和节点之间的关系组成,例如社会网络、协作网络、生物网络和交通网络等。复杂网络研究的主要问题之一是对社区结构的检测,这是一个一直备受关注的课题。现今,社区发现的许多研究成果已成功应用于朋友推荐、个性化产品推广、蛋白质功能预测和舆情分析与处理等领域。现实世界的网络通常由功能单元组成,这些功能单元以网络模块或社区的形式表现出来,这些子网络的节点在连接程度上相对于其他网络上的节点更加紧密。社区结构作为复杂网络的重要特性,在一定程度上可以反映网络的重要特征。因此,识别社区结构对于描述网络组织结构和理解复杂系统至关重要。社区发现致力于对复杂网络中社区结构的精确检测。但是,网络规模的不断扩大使得网络结构变得更加复杂,很多传统的社区发现方法在处理大规模复杂网络时存在一些缺陷。特别是,当使用经典聚类算法处理网络的高维数据时,社区发现方法的检测结果通常不够准确。针对这一问题,本文将深度学习引入社区发现研究中,旨在通过深度学习框架来提取高维输入数据的有效低维特征表示,从而显著提高社区发现方法的检测性能。在对社区发现和深度学习的相关理论知识进行深入研究后,本文提出两种社区发现方法:迁移学习影响下基于深度自编码器的社区发现方法(Community Detection Method based on Deep Autoencoder under the Influence of Transfer Learning,Transfer-CDDA)和基于集成聚类框架的社区发现方法(Community Detection Method via Ensemble Clustering Framework,CDMEC)。通过在不同数据集上的大量实验来验证本文提出的方法具有一定的可行性和有效性,并对比几种现有的社区发现方法进一步验证算法的良好性能。本文的主要工作如下:1)提出迁移学习影响下基于深度自编码器的社区发现方法(Transfer-CDDA)。该方法首先进行复杂网络原始数据的相似性处理操作,即邻接矩阵到相似性矩阵的转换。该操作是受节点间关系表示的启发,而提出了一种有效的网络邻接矩阵变换方法来描述网络拓扑结构中节点间的相似性;然后通过基于深度自编码器框架(Community Detection Method based on Deep Autoencoder,CDDA)进行特征提取操作,从而获取复杂网络的有效非线性特征表示;最后为了进一步获取更强大的特征表示,通过最小化嵌入实例的Kullback-Leibler(KL)散度将迁移学习模型引入CDDA中(简称Transfer-CDDA),以确保在学习低维表示时,不同域之间的差异可以近似相等。同时也提出了一种新的训练策略,即目标域和源域在深度自编码器的编码和解码训练过程中共享相同的参数并利用随机梯度下降的反向传播方法对提出的算法进行迭代更参优化。大量实验表明该方法在人工基准网络和真实网络上均具有良好的性能,并且在复杂的社区结构检测方面具有更突出的优势。2)提出一种基于集成聚类框架的社区发现方法(CDMEC)。Transfer-CDDA是采用单一的相似性矩阵转换方式来描述节点间的相似性关系,并通过k-means聚类得到检测结果。该方法虽然有效,但聚类结果并不稳定,在适用性上存在缺陷。为了改进这一缺陷,使算法能够充分地描述复杂网络的拓扑结构,提出一种基于集成聚类框架的社区发现方法(CDMEC)。首先,该方法采用四种函数构造复杂网络的不同相似性关系,充分描述网络拓扑结构中各节点之间的综合相似性关系;然后构建了堆栈自编码器与迁移学习的映射组合模型来获得网络的有效低维特征信息:最后采用集成聚类框架来提高聚类结果,通过基准聚类算法聚合多个输入,实现对复杂网络的高精度聚类划分效果。大量实验表明,CDMEC算法是可行且有效的,与Transfer-CDDA算法所获得的最佳结果相比较是相近甚至更优。
其他文献
细菌室是否符合标准,除其结构外,至关重要的问题是消毒是否彻底。采用不同方式,方法,时间进行消毒试验结果表明,即使按要求进行消毒后,若改变室内或室外的微小气候,对消毒结果均有极
真朱是丹砂之末 ,真珠是蚌珠。真朱和真珠原为二物 ,二者从基原到命名原因、入药年代都不相同 ;但二者自古至今多有相混。从相近时代古代方书中对同方的记载或用“真朱”或用
兖矿集团所属选煤厂在积极开拓市场的同时注重内部挖潜,如提高选煤厂的生产能力,商品煤灰分严格控制在同一级别的临界值上限,在生产管理中采用成本倒算的方法严格控制洗选成
一个集合M(?)Rd称为rq-凸的,如果对于M中任意两个不同的点x,y,都存在另外两个不同的点z,w∈M,使得conv{x,y,z,w}为一个非退化矩形.论文首先根据rq-凸集的定义给出了Rd中一些
伴随着我国手机的普及,当前越来越多的手机应用程序出现在手机上。而短视频则通过非常短的内容和较为强烈的社交属性,慢慢成为了当前人们都广泛使用的精神文化产品,用户数量
每一种新药在批准生产、推向市场使用前,都须经过动物实验、人体实验和临床试验三个过程。其中临床试验分三期,第二、三期是为了观察药物的有效性,所以受试对象为病人;而第一期试
报纸
介绍了江南大学设计学院关于社会创新与可持续设计DESIS09项目,该项目借助社会创新与可持续的设计网络(Design for Social Innovation and Sustainabilit),(DESIS))平台,以案例研究为
为适应我国旅游产业的蓬勃发展,全国大多数高校都开设了旅游管理(高职专科)专业。部分院校在探索旅游管理专业高等职业教育方面已取得了较大的成效,但所培养的人才质量与社会人才
目前,洗浴用品(洗浴场所为顾客提供的,并可反复使用的浴衣、浴裤、浴巾等公共用品)存在的卫生问题日渐突出.为了寻求高效可靠的消毒方式,确立完善的卫生管理模式,保证洗浴用
玄参科马先蒿属植物有记载入药的达50余种,在我国分布广泛,资源丰富,民间药用历史悠久;目前已经从该属植物中分离出了生物碱、环烯醚萜苷、苯丙素苷、黄酮等多种生物活性物质