图数据查询技术的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：cwq2214

【摘要】

：

图是一种通用的数据结构,能描述复杂的结构化或半结构化数据,如:XML、WWW、社会关系网络、化合物集合、蛋白质与基因网络等等。随着图在各领域内的成功应用,图数据开始迅速累

【作者】

：

李先通

【出处】

：

哈尔滨工业大学

【发表日期】

：

2009年期

【关键词】

：

图查询子图同构频繁子图频繁子图查询超图查询包含查询相交子图查询

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图是一种通用的数据结构,能描述复杂的结构化或半结构化数据,如:XML、WWW、社会关系网络、化合物集合、蛋白质与基因网络等等。随着图在各领域内的成功应用,图数据开始迅速累积。然而,数据量的增加,不但没有带来信息获取的便利,反而由于图数据的复杂本质,使得学习与研究工作更难展开。图查询是图数据集上的一个典型应用,用于从海量图数据中获取用户需要的知识。与传统查询技术相比,图查询具有自己的特点与难点,如:数据结构复杂,操控困难;子图同构已被证明是NP完全问题,是图查询领域中不可避免的基本操作之一;图数据种类繁杂,等等。正是这些难点,导致图查询技术的研究充满了机遇与挑战。本文通过对图数据查询技术的研究,归纳总结了现有研究成果的思想和优缺点,重点研究了频繁子图查询、超图查询、包含查询、相交子图查询等技术专题,主要的研究成果与创新如下:第一、现有效率较高的频繁子图模式查询算法,在生成频繁子图的过程中,对边的扩展通常采用深度优先的方法。而且,对频繁子图的每次扩展,均需要通过子图同构计算验证其正确性。然而,深度优先的扩展方式虽然能有效避免查询算法重复生成中间结果,却带来了更高的时间复杂性。本文提出了一种高效的频繁子图查询算法,通过先生成频繁子树,进而通过这些频繁子树进一步生成频繁子图。在生成频繁子树的过程中,采用深度优先的遍历方式避免中间结果的重复计算,并利用子树同构可在多项式时间内完成的特点提高该部分算法的效率。另一方面,在由子树向子图扩展的过程中,通过广度优先的方式进行扩展,不但能有效避免中间结果的重复生成,而且进一步提高了算法的效率。理论分析与实验结果显示,采用这种查询方法,使查询效率提高了O(√n·logn)倍,并在提高效率的同时,得到正确的结果集。第二、超图查询算法采用过滤与验证模式,即:通过对图集的过滤,得到更小、更精确的候选集,从而降低查询过程中子图同构次数,进而提高算法的效率。超图查询的过滤规则为包含逻辑,即如果甲图包含乙图,则甲图必然包含乙图的所有子图。查询算法的索引通常建立于图集中的频繁模式,包括频繁子图、频繁子树或频繁路径等。然而,在给定查询图之后,无论何种索引,均需要得到查询图包含的索引模式,并通过索引模式支持集的交集得到候选集。在得到查询图包含的索引模式过程中,需要进行查询图子图枚举,并与索引模式之间进行子图同构,得到查询图包含的索引模式。本文提出查询算法VFM,通过图集中关键节点与频繁模式之间的映射,将得到被查询图包含的索引模式的过程由指数形式降低为多项式形式,从而显著提高了算法效率。实验结果表明,采用该算法进行查询,其效率远高于当前已经提出的算法。第三、图查询问题包含的另一类查询问题,称为包含查询。包含查询与超图查询的本质区别在于,它采用的过滤手段为排除逻辑,即:给定查询图,如果图集中的图数据包含的某个模式不是查询图的子图,则该图也必定不是查询图的超图。利用排除逻辑建立的索引,在查询之初,同样要通过枚举或与索引模式之间逐个的子图同构计算得到不被查询图包含的索引模式,这是需要尽力避免的计算开销。本文针对图包含查询中存在的问题,提出利用频繁子图查询过程中形成的深度优先树组织索引,能增量地进行查询图与索引模式之间的子图同构计算。而且,在索引模式的选择中,提出采用频繁模式集中一类特殊的子集——频繁闭模式来建立索引,这种方式不但能极大化地减小候选集的尺寸,同时也避免了过多子图同构计算所带来的负面影响,从而提高了算法的效率。第四、图集的查询问题,并不能完全通过频繁子图查询、超图查询与包含查询解决。相交子图查询问题,能在某些条件下转化为超图查询或包含查询。然而,超图查询或包含查询解决相交子图查询问题时,需要重复进行多次查询,方可得到查询结果,效率低下。针对相交子图查询问题,目前尚无研究结果发表。本文率先提出的相交子图查询算法,通过对数据库图解构,形成基于节点诱导连通子图的有向无环图,并通过边列表对有向无环图的节点信息进行补充,不但能高效完成相交子图的查询工作,而且将索引的规模控制在了适当的范围之内。相交子图查询能解决图集中一类查询问题,因而,本文作为首篇提出该查询算法的文献,意义深远。

其他文献

一季度通用汽车在华销量同比增七成

通用汽车中国公司2010年4月2日宣布。继前两个月销量飘红后，3月份通用汽车及其合资企业在华销量达230048辆．同比增长67．9％，创造了月度销量新高。通用汽车及其合资企业2010年第一季

期刊

合资企业

光电专业实践课程改革初探

摘要：本文以我校湖北科技学院光电专业新实践课程的教学目标，培养学生思考能力、动手能力、分析和解决问题的能力为出发点，从实践课程的选题、指导方式、考核标准三个方面进行改革探索，初步建立光电专业实践课程的新模式，使學生能更清楚地掌握光电专业相关专业知识，提高学生们的综合素质，为以后工作奠定基础。　　关键词：光电专业；实践课程；改革　　中图分类号：G642.0 文献标志码：A 文章编号：1674-932

期刊

光电专业实践课程改革photoelectric disciplinepractical coursereform

图像/视频压缩技术中若干关键问题的研究

随着下一代网络(NGN)、第三代移动通信(3G)与涉及3G演进的B3G(BeyondIMT-2000,超3G)和下一代宽带无线(NGBW)等对视频、多媒体业务与网络应用需求的飞速发展,以及硬件处理平台

学位

图像压缩标准变换编码余弦变换整数变换彩色空间转换

小麦腥黑穗病的防治方法

<正> 解放前,小麦腥黑穗病在我国发生很普遍。解放后,党和政府发动群众大力防治,目前,大部分地区已基本消灭为害,但在局部地区仍发病较重,有的地区病情有回升趋势。现介绍几

期刊

小麦腥黑穗病防治方法硫酸铜

捡拾手机后擅自利用支付宝转账行为的定性

<正>一、基本案情2017年6月30日14时许,犯罪嫌疑人王某在上海市松江区佘山旅游度假区内检拾到被害人郑某的一部vivo手机后,发现该手机无开机密码,且支付宝APP也没有退出登陆,

期刊

支付宝支付密码盗窃罪冒用他人信用卡信用卡诈骗罪

微生物检验中PCR技术运用价值分析

目的:探讨临床微生物检验中运用聚合酶链式反应(PCR)技术的价值。方法:随机选取2017年12月~2018年12月期间在本院接受诊治的114例患者,收集全部患者临床标本,运用PCR技术进行

期刊

微生物检验聚合酶链式反应技术价值分析

合资企业需有中方“品牌”的声音

【正】在各大商学院的汽车管理教学案例当中,也许新联合汽车制造公司(New United Motor Manufacturing,Inc.,简称NUMMI)一案会格外引起中国汽车业界人士的瞩目。这所曾是日本

期刊

合资公司汽车制造公司汽车品牌

后金融危机时期中国对外直接投资基本动因的变迁

对中国"走出去"战略实施以来对外直接投资基本动因及其在后金融危机时期的变迁进行实证研究,结果发现:第一,中国对外直接投资总体上显著受到寻求市场动因、寻求技术战略资产

期刊

后金融危机中国对外直接投资寻求市场动因寻求技术动因寻求自然资源动因“一带一路”

胡适五四时期的新诗活动刍论

【正】 “五四”新文化运动是一场彻底的反帝反封建的革命运动。这个运动的阵营是由“共产主义的知识分子、革命小资产阶级知识分子和资产阶级知识分子(他们是当时运动中的右

期刊

白话诗《谈新诗》新诗创作文学革命新文学民主主义思想《尝试集》白话文学五四时期

再议中国实施托宾税的必要性

次贷危机的全面爆发，使得几经搁置与推崇的托宾税又被推到历史前台。上世纪末曾有学者指出：中国当时尚不具备实施托宾税的可行性，本文从次贷危机对中国的影响出发，提出为应对国际

期刊

次贷危机托宾税必要性

图数据查询技术的研究

其他学术论文