基于宏森林自动机的XML流数据并行查询技术的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:zhangg91
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML数据格式因为其固有的优点:可扩展性、内容和形式相分离、便于不同系统之间信息的传输等,在信息管理、电子商务、移动通信、电子文档交换等诸多领域得到了广泛的应用,已然成为新一代Internet上数据表示、传递和交换的标准。随着互联网的飞速发展,很多基于网络的应用系统,如网络日志的信息采集与分析、股票技术分析、互联网的安全监控、位置信息的监测等实时系统中出现了大量的随时间的延续而无限增长的动态数据集合,这些数据被称为流数据,而XML流数据是这种流数据的常见表现形式。对于流数据,我们无法预知其数据的边界及大小,则对流数据进行全部存储就是不切实际的。而传统的XML数据库查询机制对于高速的、有序的、实时的、只单遍扫描的XML数据流已然不再适用,这无疑是给XML流的查询处理提出了新的挑战。因此,怎样高效地对这些流数据进行查询、过滤和解析是目前XML数据流研究中的热点话题。自动机是由输入驱动的计算模型,与XML流数据在线到达并产生SAX解析的事件相吻合;而在以往的XML数据查询处理的研究中,也已有不少利用自动机来处理XML数据的方法。近些年在处理XML流数据的研究中使用的宏森林自动机是一种以XML森林作为输入、XML森林作为输出的有限自动机,其查询处理的性能也已达到了较高水平,也比较适合用来处理XML流数据。XML数据流的查询问题主要归结到XPath的查询,因此自动机技术自然而然地被人们运用到针对XPath的查询处理中,利用自动机来对XPath表达式建模。本文提出一种在多核处理器上基于宏森林自动机来并行处理XPath查询的方法,充分利用了用宏森林自动机处理XML流的高性能优势以及多核处理器的特点来提高查询效率。该方法根据XPath查询表达式生成一个查询自动机,流经解析器的XML数据流转化为一个个的事件流,自动机会以这些个事件流作为输入,然后将根据不同的输入事件在各个状态之间转换,并且将查询中出现的不同任务分配给不同的线程去执行,一旦数据流的某一部分完全匹配既定的XPath查询表达式,自动机就输出查询结果。该方法支持的XPath范围包括PC轴(子女查询child)、AD轴(子孙查询descendant-or-self)以及任意多个并列谓词和任意层次的嵌套谓词,实验表明这种XML流数据的并行查询方法既能支持复杂的XPath查询,同时具有良好的执行效率。
其他文献
随着信息技术的迅猛发展,网络信息量呈爆炸性的增长。以互联网为载体的海量数据蕴含着大量信息,有效的分析并挖掘这些信息中的价值是很有必要的。文本分类技术是数据挖掘领域
研究发现,释义是促进词汇附带习得的有效途径之一。通过释义这一方式将学习者的注意集中到到目标词,从而强化语言输入。因此,学者们对不同的释义语言对于词汇附带习得的有效
近年来,在党中央“走出去”的战略指引下,各大企业的技术实力、人员能力、管理水平、成本控制等方面都有了跨越式的提升,其承揽的国际工程项目在数量、规模和重要程度上也都
目的:本研究旨在研究益气升阳法对气虚型前庭性偏头痛的临床治疗效果,明确益气聪明汤对本病的治疗作用及作用机制,确定其安全性,并进一步探讨气虚病机对前庭性偏头痛的影响,为中医药治疗本病提供新思路并指导临床实践。方法:本研究选取对象均符合纳入、排除诊断标准,共60例,采用随机对照试验方法,随机将60名患者分为治疗组、对照组两组,每组各30例,两组之间在性别、年龄、病程方面无明显差异(P>0.05)
感应耦合非接触式电能传输(ICPT)技术是对传统有线电能传输技术的一次重大变革,经过将近三十年的研究与发展,已经建立起一套较为完整成熟的理论体系。目前,该技术在交通运输
本论文选取我院中医护理门诊2018年12月至2019年10月心脾两虚型失眠患者240例,按照随机数表的方法将240例患者随机分为A、B、C、D四个组,每个组患者60例,其中A组为常规护理组,B组为常规护理+认知行为疗组,C组为常规护理+揿针组,D组为认知行为疗法+揿针+常规护理组。分别对A、B、C、D四组予以认知行为疗法治疗、揿针治疗和一般药物护理治疗,治疗前、治疗后1月、2月对患者进行匹兹堡睡眠
蓝细菌Synechocystis sp.PCC 6803是仅需太阳能、CO2和水就能够生长的原核微生物,作为光合细胞工厂其已经能够合成多种生物燃料。但是蓝细菌底盘细胞对生物燃料毒性的低耐受
随着立体视觉、虚拟现实和3D动画等领域的迅速发展,对重建对象的复杂性和生成图像的真实感要求越来越高,从而研究复杂对象的高精度三维重建与绘制成为急需解决的问题之一。近
云计算具有按需供给、按使用付费的特点,已成为执行大型应用的有效方式之一。在云计算中,应用通常以工作流的方式被提交执行。合理的工作流调度能极大改善云计算的整体性能并
一个国家,一个民族,如果其人民没有信仰,这个国家亦或民族就不会得到发展乃至延续,更不会创造出灿烂的文明。古希腊文明至今为西方文明的发展提供源源不断的动力。而儒家文化