不确定网络中概率模体挖掘算法的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:yw1234c
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
许多经典问题都用图结构来表示,图结构与关系数据相比有着更强的表达能力。网络模体的挖掘是研究复杂网络的重要分析手段,网络模体是指网络中频繁出现的互相连接的子结构,其在原网络中出现频度明显高于在随机网络中出现频度。实验表明,网络模体的研究有助于研究网络的功能模块和网络动态变化过程。目前,国内外学者对模体的挖掘的研究已经有了一定进展,其研究主要集中在确定网络模体挖掘。然而,在现实生活中,信息不精确、甚至缺失常常是无法避免的,此外,网络表示的问题本身也可能是动态变化的。这使得抽象出的图模型,往往带有不确定概率信息。因此,本文针对不确定网络概率模体挖掘进行了研究,主要工作包括:(1)基于概率距离的性质,提出了不确定图概率同构的概念。并对不确定图概率距离进行了推导,所得的定理为后续算法的实现提供理论依据,并且简化了计算法则。(2)提出了不确定图概率同构算法。在经典图同构算法VF2算法的基本框架上,将不确定图概率同构概念纳入搜索过程,使得算法能够找到满足条件的最优匹配。实验验证了该算法能快速判断不确定图概率同构。(3)提出了一种不确定网络频繁概率模式挖掘算法。该算法采用基于划分的非树形子图方法搜索指定大小的子图,利用分级层次聚类算法对子图集合进行聚类。该算法能够快速地在不确定网络中批量地得到频繁概率模式。(4)提出了一种概率模体统计意义评价算法,该算法将原网络的拓扑特性与概率权值进行分离,利用确定网络随机产生算法使得网络的拓扑结构得到充分的随机,利用EM算法得到概率权值的概率分布。对于特定概率子图,用期望估算该概率子图在随机网络中的频度和方差。利用拟合优化检验评价参数估计的质量,在生物网络的实验中证明了对模体评价的有效性。
其他文献
随着P2P技术的日渐成熟,越来越多的网络应用都使用了P2P技术,特别是在文件共享领域与流媒体播放领域,P2P技术的使用发挥到了极致。然而正是由于这种技术的出现,P2P流量占据了很大
随着云计算和大数据时代的到来,电子数据的存储量呈几何级增长。同时,近年来自然灾害和人为事故的频发导致数据中心存储设备损坏,给许多数据中心造成不小的损失,企业、高校、
随着计算机软件技术的发展,软件产品的应用功能和系统结构日趋庞大和复杂,软件测试过程中产生的运行剖面越来越多,这给计算机软件开发后期的软件可靠性测试工作带来巨大的挑
学位
教学管理工作是学校办学的重要工作之一,随着计算机技术和网络技术的发展,教学管理工作也从传统的手工处理解脱出来,采用现代化的办公自动化系统--教学管理系统来完成。教学
JXTA是用来解决P2P(Peer-to-Peer)对等计算的分布式网络计算平台,也是一个为P2P应用程序和服务提供标准协议的开放式资源项目。JXTA是juxtapose:并列)的缩写,这不仅说明网络中
钢结构节点设计是钢结构设计的重难点,采用传统的CAD(Computer Aided Design,计算机辅助设计)技术,很难灵活地进行钢结构节点设计。为此,将虚拟装配引入到钢结构节点设计中,
无线传感器网络是由部署在监测区域内大量的、廉价的、具有感知能力的微型传感器节点形成的一个多跳自组织网络。随着它的广泛应用和产业化实现,其安全问题日益突出。本文首
近年来词的分布式表示与组合模型在自然语言处理领域中取得了诸多突破性的成果。词的分布式表示使用实值向量对词进行建模,可以从无标记语料库学到词的语法和语义信息,而组合
在多标签分类问题中,每个样本同时对应多个标签构成的标签集合。多标签分类问题与传统的分类问题最主要的不同在于传统的分类是假设标签之间两两互斥,而多标签分类中标签之间
1993年,Aharonov提出了量子随机行走的概念,相比于经典随机行走,量子随机行走具有更快的扩散速度。2003年,第一个量子随机行走搜索算法,即SKW算法,从理论上证实了量子随机行