基于复杂网络的网络大数据聚类研究

来源 :兰州交通大学 | 被引量 : 1次 | 上传用户:jimgreen22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通讯科技和IT技术的飞速发展,网络规模不断地扩大及结构逐渐的复杂,使得网络产生海量信息数据,即大数据(Big Data)。大数据的出现使得人类社会从信息时代过渡到大数据时代。在大数据时代,网络数据表现出复杂性、多样性以及异质性等特征。在真实网络中,社区结构(又称聚类特性)是复杂网络大数据的重要特征,即社区内部连接比较紧密,社区之间连接比较稀疏。社区结构是分析网络大数据的关键与基础,具有重要的研究价值和科学意义。目前社区发现已经成为数据挖掘等众多领域最具挑战性的研究课题之一。本文主要围绕同质网络和异质网络社区发现算法进行研究,主要包括以下几个方面的内容:(1)为了能够有效地挖掘复杂网络中的重叠社区结构,本文提出一种基于极大团连接相似性的重叠社区发现算法。该算法引入极大团思想来初始化网络的社区结构,并根据团间的共享邻居节点和团间桥接边对社区间的连接性进行量化处理,以此为依据合并网络中的社区,得到较为合理的重叠社区结构。将该算法与经典的CPM算法在四个真实网络上进行对比实验,实验结果表明,通过本文算法得到的网络社区结构在精确率、覆盖率和模块度等方面有所提高,证明该算法发现的重叠社区结构较为合理。(2)针对传统的同质网络社区发现算法无法充分利用异质信息的问题,本文提出一种基于语义路径的异质网络社区发现算法,充分考虑网络中异质节点和边所包含的信息。该算法首先通过FindPath方法选取语义路径;然后提取出不同语义路径下对象的相似性矩阵;最后提取不同语义路径下的对象特征并进行融合,采用K-Means算法得到最终的社区划分结果。并在真实数据集上进行实验,实验结果表明该算法的有效性。(3)针对异质网络的社区发现算法中无法充分保留异质网络原始结构及其信息,而且较少考虑异质节点同属一个社区的情况,本文提出一种基于二部极大团的异质网络社区发现算法。该算法引入二部极大团理论:首先,以关键节点所属规模最大的二部极大团作为初始社区;然后,以量化的社区的邻居节点与社区的相似性为依据对社区进行扩充;最后,划分出合理的社区结构。通过在人工异质网络和真实异质网络上进行对比实验。实验结果表明:该算法所划分的社区准确率和模块度都相对较高,证明了该算法能够有效的发现异质网络社区结构。
其他文献
山西是中国农耕文化的发祥地和黄河中游古老的农业产区,有着悠久的历史和丰富的农产品资源。在香飘四溢、色彩斑斓的粮食家族中,山西省的小杂粮无疑是最引人注目,最值得称道
对极坐标表示的面积绕轴旋转的体积计算问题分别从积分元素法、P.Guldin定理及球坐标下三重积分计算 ,给出三种计算方法 .本文不仅导出了一类旋转体体积的简单计算公式 ,而且
聚乙烯醇生产过程中,当反应体系黏度达到一定值时,会产生“凝胶效应”,从而制约高聚合度产品的生产。通过对聚合率-聚合度-黏度的研究,提出了“两步法”加溶剂甲醇的生产工艺,解决
实验采用分离神经细束的方法 ,观察逆行电刺激大鼠脊神经背侧皮支后 ,在相距较远的神经细束上记录到的Aδ和C类机械感受单位电活动的变化。刺激T9脊神经背侧皮支 ,在T12神经
本文采用文献资料法、逻辑分析法等研究方法,根据当前社团教学的教育价值和教学优势,以兴趣社团在跆拳道教学中的创造性和现实意义为切入点展开研究,对跆拳道兴趣社团的发展
本研究以宁夏固原天然草地、农地、撂荒地和不同年限的柠条林地为研究对象, 分析了不同植被类型下土壤养分和土壤微生物生物量碳、氮、磷的变化。研究结果表明: 土壤养分除速
提出了一种基于免疫多样性的分布式入侵检测方法,将支持向量机(SVM)作为抗体对入侵行为进行检测.首先,采用随机子空间方法生成多样化的SVM个体,再用人工免疫算法进化个体,然后通过引
目前我国行业信息化建设已经跨越了初级阶段,但在许多行业的信息化应用中还存在着"烟囱"效应和"信息孤岛"效应。为了将行业信息化引向深入,需要对原有系统进行数据集成。文中
一 教学方法和手段是达到一定教学目的的重要工具。我国教育界一直比较重视教学法的研究工作,施教之功,“贵在引导,重在转化,妙在开巧”。文献课一出现,就有人着手对其教学
<正>中国传统文化审美有三个来源,分别是来自儒家思想的&#39;仁&#39;、来自道家思想的&#39;游&#39;、来自禅宗的&#39;悟&#39;。在中国人的观念中,他们不是截然分开的,在一个