基于双索引的子图查询算法

来源 :复旦大学 | 被引量 : 0次 | 上传用户:sheng45724575
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图作为一种通用的数据结构可以用来表示各种复杂的数据,被广泛的应用于化学、生物信息、软件工程、社交网络以及互联网等领域中。对于图数据库的管理与传统的数据库有着诸多不同,其中基于图数据库的查询更是有着明显区别。而查询匹配过程中重要的一环工作是子图同构检测,但是同构检测本身是NP问题。为了降低花费在同构检测上的时间消耗,我们可以通过建立有效的索引来减少查询过程中候选图的数量,从而缩短整个查询所需的时间。  大部分的子图查询算法仅考虑在图数据库上进行一次挖掘频繁子图算法,在建立了稳定的数据库索引后,将不再对索引进行更新。这种算法可能遇到的问题是:随着查询兴趣的改变或者数据库的频繁更新,原先的数据库索引将不再能提供有用的信息来有效地减少查询过程中候选图的数量。  针对该问题,本文提出了双索引结构,同时在数据库和查询流上建立索引。算法采用时间窗的概念定义了查询流上的频繁子图,在查询处理的过程中实时地挖掘查询流频繁子图,建立查询流索引作为数据库索引的补充。即使查询兴趣改变,查询流索引也能自适应地更新索引信息来提高查询效率。针对数据库的频繁更新,并不需要在数据库上重新进行频繁子图挖掘来建立新的数据库索引,因为查询流索引已经提供了实时的有用信息。同时,本文也对现有的数据库索引建立算法进行了改进,采用了更高效的基于BFS边扩展的频繁子图挖掘算法建立数据库索引。
其他文献
互联网技术的发展逐渐给人们带来了新的计算方式,云计算即是互联网发展的产物之一。云计算通过将众多计算资源整合抽象成虚拟计算环境的方式,向用户提供虚拟的计算资源,具有
随着人工智能领域在近年来的飞速发展,人们对于计算机理解自然语言的能力提出了崭新的要求。而文本推理技术作为自然语言理解领域的研究基础,与信息检索、信息抽取、自动问答
本文对计算网格中基于博弈论的算法机制进行了研究。文章对博弈论、算法机制设计研究的相关理论进行了阐述,将博弈模型引入分配机制设计进行建模,给出了模型的纳什均衡的求解定
基于数据库服务模型的数据发布架构,由于其易扩展性及高效管理庞大用户和数据的能力,如今越来越受到业界的关注。该架构中一个重要问题就是数据的安全性问题。这就需要有一种
企业应用集成(EAI)通过在异构系统之间共享数据、业务逻辑来实现业务功能的无缝集成。应用集成是一种更高级的软件复用,是多种技术的复合。各种中间件技术成为EAI的有力支撑:消
随着WEB技术的发展,基于Web服务的应用集成成为应用系统集成研究的热点。但是,在这方面,还有许多问题需要探索。例如,跨Web服务的Web服务事务管理问题、Soap路由问题、Web服务的
人类基因组计划的完成标志着现代生命科学研究进入了系统生物学时代。系统生物学不仅仅是一个新兴的领域,更重要的是它代表一种对生物学研究的新方法。人们逐渐认识到在研究
自从计算机问世以来,信息技术得到日新月异的发展。随着信息技术的飞速发展,人类正迈入以网络为主的信息时代。越来越多的人通过Internet进行商务活动。但是由于Internet的开
本文从应用层网关入手,采用处于用户态下的Winsock2SPI技术,拦截套接字函数,截获网络数据包。截获了网络封包之后,需要通过协议解析器对网络封包进行协议解析,协议解析模块首先需
在信息时代潮流当中,嵌入式技术扮演了承上启下的桥梁作用,它和传统的工业控制技术有着密切的联系,又结合了最新的计算机软硬件技术。和传统的桌面系统类似,嵌入式系统也需要能够