面向大图数据的子图相似匹配算法研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:ponny2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图作为计算机科学的一种基本的数据结构,可以用来描述存在多种关系的复杂数据,如社交网络,蛋白质交互网络,化学分子结构,交通网络等等。子图精确匹配是图数据库管理的一种基本操作,其概念是在数据图中查找出用户给定查询图的全部匹配,目前已经有大量关于子图精确匹配算法的研究成果,但是随着互联网技术的飞速发展,各个领域的数据量呈爆炸式增长,图数据的规模越来越大,导致其不可避免的存在噪声数据,而且子图精确匹配通常不能满足用户的模糊查找。基于这些因素,子图相似匹配作为子图精确匹配操作的一种延伸,具有重要的研究意义。子图相似匹配的概念是给定查询图q,数据图G,临界值θ,对于每一个查询图q至多缺少θ条边的查询子图p,在数据图查找出p的全部精确匹配。那么无论是精确匹配还是相似匹配,其基本内容仍然是子图同构问题,子图同构问题已经被证明是NP完全问题,为了提高查找效率,本文分别从构建索引和利用云计算环境两方面考虑,提出了两种子图相似匹配方法,分别为基于索引的子图相似匹配方法和基于云环境的子图相似匹配方法。在基于索引的子图相似匹配方法中,主要是利用混合邻居单元来对数据图的每个节点构造索引,并利用多个查询子图可共享一棵生成树的特点,来利用随机生成树集的剪枝能力来提高查找效率,另外,对查询图的所有查询子图,提出了一种类似频繁挖掘的深度优先的枚举顺序,以此来剪枝掉不匹配的子图。在基于云环境的子图相似匹配方法中,主要分四步来完成整个查找算法,首先对查询图松弛为符合θ约束的查询子图集,然后将这些查询子图集分解为更小的查询结构,即h树,然后在机器群中对h树集实现并行精确匹配操作,最后,将匹配结果进行连接来获得最后的查询结果。本文的最后会对基于索引的子图相似匹配方法与基于云环境的子图相似匹配方法做实验对比分析,分别利用真实数据集与合成数据集来验证在实现面向大图数据的子图相似匹配算法中,这两种方法的有效性与可扩展性。
其他文献
<正>创业板退市制度是一项重要的基础制度,事关资本市场的内在稳定机制,下一步关键是在出台退市机制的过程中提高前瞻性、针对性、有效性建立健全创业板退市机制是今年全国证
<正>当我的手指在键盘上飞舞时,说真的还真无法从那些漂亮的画面上挪开视线,多么神奇的一个地方——晨辉照射在白墙红线、四角屋顶尖角挑起的藏式民居上,座座藏寨鳞次栉比地
期刊
目的了解新疆新源县城市社区居民对食管癌防治知识的认知现状,为进一步的健康教育提供参考依据和政策建议。方法采取整群抽样的方法,对2009—2010年新源县某社区758名居民进
<正>"产业兴旺,生态宜居,乡风文明,治理有效,生活富裕",是习近平总书记在党的十九大报告中提出的乡村振兴战略的总要求,相比较十几年前提出的新农村建设目标"生产发展,村容整
徐艳丰,一个地地道道的北方农民,中等个儿,黑红脸,忠厚老实,寡言少语。生活的艰辛使他的外表比实际年龄要老许多。但他那充满智慧和毅力的炯炯目光,令人难忘。30多年来,他用一双神奇
报纸
借鉴软件开发的能力成熟度模型,提出图书馆知识管理能力成熟度模型框架,旨在探讨对图书馆知识管理能力水平的评价方法,帮助图书馆改善知识管理能力,以增强其竞争力。
<正>1引言GPS,GRACE以及地球物理模型都能有效的刻画地表周年性形变。前期的研究表明,三种手段获取的地表周年变化在一定范围内吻合较好。但是,在一些区域,三种手段获取的周
会议
高考是最大的民生工程,关系到千家万户;高考是"指挥棒",关系中国教育的未来。高考方案需要顶层设计,也需要"接地气"。高考改革是一个系统工程,需要协调和统筹。本文试图对此