高效的稠密子图查询算法的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:jxnydxlhy1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图是一种灵活的数据结构,只要涉及到关系就可以表示成图的形式。图在实体网络,软件网络,社交网络中都有很多的应用。然而,大图很难被人们所理解和应用。人们往往喜欢某些特定的结点和连接结构,而认为其余的部分都是不相关的。从大图中挖掘出一个连通稠密子图就是一个基于这种情形的应用实例。例如考虑一个由一百万个结点和八百万条边生成的疾病生物图,给定几种疾病,挖掘出一个小的子图,要求尽量的连通各种疾病。带着几十个结点的稠密子图能很好的给出一个关于这几种疾病直接关系的图例。然而原始的疾病生物图,却不能清晰的给出几种疾病直接连接关系。本文主要讨论了稠密子图的查询算法。首先给出了稠密子图的问题定义:给定一个数据图和一些查询点,寻找一个包含所有查询点并且满足评价函数最大的稠密子图。这里的评价函数主要考虑两个因素:一个是子图相关度,另一个是子图稠密度。然后针对随机游走计算相关度需同步更新迭代的特征,提出了一种快速计算相关度的异步更新的BFS相关度方法。其次对于稠密子图的发现问题,提出了一个Fastsubgraph发现稠密子图的算法,该算法首先寻找一个包含查询点的子图集,然后动态组合子图集,利用评价函数筛选分值最大的候选子图,最后对不满足条件的候选子图进行扩展,得到最终的稠密子图。最后将算法CEPS和SISP算法改进为CEPSplus算法和SISPplus算法,使其也能发现稠密子图。CEPSplus算法的思想是先找一个包含所有查询点的连通子图,然后不断的添加结点,直到子图满足结点个数的限制并且评价函数最大。对于SISPplus算法,首先对粒子初始化阶段进行了改进,使其初始化速度更快;同时本文也修改了计算粒子的适应度公式;最后根据稠密性的信息特征,对算法的更新阶段进行了改进,使其能发现稠密子图。本文在实验阶段分别比较了FastSubgraph, CEPSplus, SISPplus算法在随机游走相关度和广度优先遍历相关度下的性能和参数信息。间接的证明了本文所提出的广度优先遍历相关度的正确性。通过用户评测的方法表明FastSubgraph, CEPSplus, SISPplus算法都能找稠密子图,但Fastsubgraph发现稠密子图的效果较好。
其他文献
该文研究了网上营业厅的系统模型和相关技术,并结合网上业务销售的支付功能进行探讨和分析,为网上支付功能的实现提出了实用性的模型.并针对网上支付和网上营业厅系统涉及的
随着Internet的发展,电子商务正以其高效、低成本的优势,逐步成为企业新兴的经营模式和理念。越来越多的网站投身到提供电子商务服务的行列中来,越来越多的企业开始将自己的业务
入侵检测技术是一种主动保护网络资源免受黑客攻击的安全技术.该文首先讲述了入侵检测技术的发展状况和关键技术,对现有系统进行了分类,并说明了现有IDS的不足以及今后ID技术
随着网络的发展,网络安全问题被提到了一个前所未有的高度,作为安全技术核心之一的入侵检测技术(IDS)也成为网络安全领域研究的焦点。目前,入侵检测技术主要分为两种:误用检测和
数字指纹协议的研究就是为了从密码学的角度提出能够有效的追查非法拷贝源的方法,在一定的前提下可以应用于各种类型的软件产品(图像、文档等).其基本思想是类似人类手指指纹
近年来,计算机技术与互联网技术迅速发展,给人们的工作和生活方式带来了巨大的改变。随着信息技术革命的不断发展,各种各样的网络服务不断涌现,互联网的规模急剧扩大,网络设
中间业务是银行经济新的增长点,本文研究的目标就是建立一个中间业务的通用处理平台——中间业务平台,并以中间业务平台为中心构建中间业务处理系统。 针对中间业务的特点,本
该文主要对基于面向对象的软件开发的发展、理论和应用作了初步探讨.该文首先简要介绍了已经使用多年的基于C语言和FoxPro数据库系统开发的一个小型售电系统.通过对该系统的
分布式系统作为计算机领域的研究热点之一,近年来受到了广泛的关注。其中的任务调度问题,对发挥系统的并行性能和保持负载平衡具有重大意义。任务调度问题是指根据一定的调度策
该文在远程教育的应用背景下,提出用Agent 程序设计技术来解决在该应用中所遇到的问题.第一个是名为CLAM( CollaborativeLearningbasedonmulti-AgentModel)的网上合作学习架