复杂网络动态模式挖掘若干算法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:tenderboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂网络的挖掘研究拥有广泛的应用领域,例如生物网络、化学网络、Internet、合作网和社会网络等。挖掘动态网络模式已经引起了极大的关注,这是因为现实世界中大多数的复杂系统都是动态演化的,可以用动态可变的网络来描述,其蕴含的动态模式无法用静态网络准确描述。已有的频繁子图模式、聚类和社区结构挖掘等问题的研究成果,大都足基于静态网络的,仅能反映动态网络中一个子图内的模式,并不能很好地揭示时间和空间区域内所蕴含的演化模式与演化规律。挖掘动态网络中隐藏的动态模式为我们带来了全新的挑战。本文对多种动态演化模式挖掘的若干问题和算法进行了深入探索,力图从微观角度揭示复杂网络在时空区域内的演化规律,主要研究工作如下:   (1)关于动态网络的挖掘,目前主要集中在挖掘无权图的拓扑结构,较少涉及有权图的挖掘,然而动态有权图在真实网络中是大量存在的,权值的演化也是网络演化中不可分割的一部分。针对动态有权图,提出了一种基于相关子模式的δ-STC模型,并设计了一种联合聚类(Biclustering)算法δ-STC,挖掘在一定时间区间内边的权值演化趋势线性相关的时空区域。算法以后缀树为索引结构,避免了穷举各种模式,从而快速提取全部聚类结果。合成数据与真实基因调控网络数据的实验证明了算法的有效性和可行性。   (2)对动态有权图,挖掘权值变化非线性相关的趋辨Motif。趋势Motif是一种有向子图,反映拓扑结构与权值共同作用时在一定时间区间上的演化模式。引入广义信息论中二次互信息作为相似性函数,结合滑动窗口技术,建立了一种权值向量非线性相关模型。在此基础上提出了复杂网络趋势Motif挖掘算法MI-TMotif。实验结果显示MI-TMotif算法具有良好的运行性能,成功挖掘出非线性相关的趋势Motif。   (3)研究动态无权网络微观演化模式的挖掘问题,即从边演化的角度,挖掘在时间维上反复出现的子图序列和对应的演化动作序列。提出了挖掘算法EPMiner,以随机过程的状态转移描述演化过程,以演化时子图拓扑结构的变化描述演化模式,提取其中的频繁模式,以揭示演化动作与频繁子图拓扑结构之间的关联关系。通过挖掘合成数据与真实数据,验证了算法的有效性,所得到的演化模式显示,此类模式能够提供丰富的动态演化信息。   (4)已有的频繁子图挖掘方法,通常是挖掘时间上同步的频繁子图,或者忽略时间因素,不能移动时间标记进行对齐,即不能识别时间异步的频繁子图。为揭示更加复杂的演化模式,对动态无权图,挖掘在时间维上的频繁演化Motif,即由同步同构和异步同构的频繁子图所构成的演化状态序列,从而观察子图结构在随时间演化时所经历的演化轨迹,揭示局部子图结构在演化中所起的作用。提出了挖掘算法CloEM,首先生成单独的频繁Motif,然后扩展构造闭合的演化Motif。为有效提取闭合演化Motif,提出了既能扩展频繁演化Motif,又能有效剪枝,并同时完成闭合检验的混合扩展策略,该策略无需维护候选集。实验表明,CloEM算法能够有效挖掘出隐藏住数据中的频繁演化Motif。
其他文献
当前,几乎所有的入侵检测系统采用的免疫模型都是基于传统的“自我和非我”(SNS)理论。该理论认为机体免疫系统对自身的抗原不产生免疫应答,而对外来的“非我”抗原产生免疫
传统的纸笔测验(Paper and Pencil Test, PPT)对于所有被试施测的是同样的试题,是“千人一卷”的测验,但是由于不同被试的能力水平差异较大,为了使试卷能够测出占总体大多数的中等
核磁共振成像(Magnetic Resonance Imaging, MRI)技术以其无创伤,软组织分辨率高,成像数据丰富等特点,已广泛应用于医学图像的获取,并在临床医学诊断上也起到越来越重要的作
色彩迁移是指将一幅参考图像的颜色特征传递给另一幅目标图像,使目标图像具有与参考图像相似的色彩。它是当前计算机视觉、虚拟现实与可视化等领域的一个新兴的技术,具有广阔
随着“互联网+”理念的涌现,加速了互联网等相关行业的发展,也带动了传统的行业和更多的企业以及个人加入到互联网中来,从而在互联网中产生了大量的信息。为了企业或用户更好
随着大数据时代的到来,Internet上的知识数量呈现指数级增长,其内容变得更加丰富、形式更加多样,如何将这些知识进行快速地、准确地组织和管理成为计算机相关领域的研究热点
数据挖掘是从大量的、不完全的、有噪音的、随机的数据中获取潜在的、有用的信息和知识的过程。聚类分析是数据挖掘重要的组成部分,它是一种无监督的学习方法,不需要关于数据
基于图论的图像分割方法是近年来国际上图像分割领域的一个新的研究热点,其基本思想是将图看作一个带权图,其每个节点对应图像的一个像素或区域,连接每两个节点的边的权值表示该
目前世界正处在一个信息爆炸时代,网络资源以几何形式迅速增长。人们可以通过搜索引擎很容易从互联网上获取信息,但是由于传统的搜索引擎仅以关键词组合进行检索和其返回的结
在当今形势下,在各行各业,产生了大量的数据,用户关心的重点问题是如何从大量的数据中快速有效的找到自己想要的数据,也即用户对于数据搜索能力的要求越来越高。索引机制有效