图数据精确查询与近似查询的研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:flangxisi888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代信息技术的高速发展,数据的结构形式变得越来越复杂。图作为一种一般数据结构,能够对复杂结构的数据以及数据和数据之间存在的相互关系进行建模,这使得图数据管理的应用领域越来越广泛,比如在医药信息学、生物信息学、社会网络、地理信息系统等。图查询作为图数据管理的一个重要研究方向,具有广泛的研究意义,能够帮助人们从大量的复杂数据中快速检索到有价值的信息。作为一门新兴的学科,越来越多的研究人员正在关注数据查询领域。目前,图数据查询基本上都采用“过滤-验证”机制,先对需要查询的数据进行过滤,得到候选集,再对候选集进行精确验证。过滤的目的是为了尽量减少验证的次数,而图的验证主要是进行图的同构测试。众所周知,图的同构测试已被业界证明为是一个NP难题。如何更为有效的获取候选集,降低计算复杂度,提高查询的效率,是一个具有广泛实际意义的研究课题。因此,为了提高查询的效率,研究人员采用在图数据库管理系统中对图数据库建立索引结构。用离线的建立索引的时间和空间消耗,来减少在线的查询执行的时间和空间消耗。本文就图查询过滤阶段如何有效构建索引做了以下工作:首先,本文介绍了图查询的基本概念,图查询的类型,图查询技术的分类以及图数据研究中存在的主要问题,并且详细介绍了几种经典的图查询算法,分析归纳了这些算法的优缺点,为后面的研究工作奠定了一定的理论基础。其次,针对图的精确匹配查询,本文利用频繁子图建立索引,提出了一种新的索引算法,解决了GIndex算法中存在的“冲突”问题。算法首先由频繁子图得到特征集,将特征集组织到DFS树中,并对其进行DFS编码,使特征图序列化,最后利用双哈希函数将其实现存储,建立索引。整个算法解决了编码过程中的“冲突”问题,使得“过滤”阶段效率更高。再次,针对图近似查询问题,本文提出一种新的查询方法。算法采用在图的拓扑结构类型上进行近似查询,对图的拓扑结构进行解构,得到不同尺寸的项集并组织在DAG图中,再由查询图的最小生成树找到最大公共子结构,对其进行扩展,得到满足近似阈值的扩展生成树。然后对得到的扩展生成树进行图的标准编码,将其放入DAG中进行快速索引查询,可得到近似子图和近似超图候选集。该算法通过枚举策略,以空间换取时间,一定程度上提高了查询的效率。最后,本文对提出的算法思想进行了实验验证,并对实验结果进行了对比分析,进一步表明了算法思想的可行性和正确性。
其他文献
聚类分析是数据流挖掘中非常活跃的研究领域,它根据最大化类内相似性和最小化类间相似性的原则,把相似的对象聚在一起而把相异的对象分离。目前已经提出许多聚类算法来发现不同
随着信息技术的出现和发展,信息系统的管理逐步成为一个重要的研究领域,系统管理的范围从最初单纯的硬件管理,逐渐发展为对整个信息系统乃至信息系统所承载服务的管理。随着这一
学位
在计算机技术、分布式技术快速发展的今天,业务流程管理BPM作为一种有效的管理系统,具有高效的调度特点,可以实现跨部门、跨企业之间的业务协作,备受企业家、商家和学者的青睐。B
随着计算机网络技术在政治,军事,商业等领域的广泛使用,网络流量的高速增长,使得网络安全的问题日益突出,作为网络安全的核心问题数据包分类技术显得尤为重要。L7-Filter是Linux系
人脸识别一直以来都是计算机视觉和模式识别研究中的热点问题,对于具有不同头部转动姿势的人脸识别,估计人脸头部姿态是必要前提,因而具有重要的研究意义和实用价值。流形学习是
随着互联网发展,网络流量爆炸式增长,面对灵活多样的应用需求,互联网固有的架构早已不堪重负,网络需要融入更多的灵活性,即通过对网络的感知、配置从而灵活有效的利用资源。SDN软
学位
学位
随着社会的发展,服务行业越来越受到人们的重视。如何提供高效率和高质量的服务关系着企业生死存亡。互联网的发展使得越来越多的人选择利用网络来获取信息,因此企业更加注重在