基于SLCA语义的不确定XML关键字查询技术研究

来源 :内蒙古科技大学 | 被引量 : 0次 | 上传用户:wiltonx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,XML数据的查询技术已经成为研究的热点。根据查询模式的不同,XML数据查询分为XML结构查询和XML关键字查询,但是对比XML结构查询,更多的用户习惯于不需要专业领域知识的XML关键字查询。随着数据采集和处理技术的进步,真实世界中的大部分数据都是不确定的。不确定XML数据是近年来研究者们提出的一种新的不确定数据的表示形式,不确定XML数据已经大量应用到金融、电信、军事等领域。目前对于不确定XML的关键字查询的研究很少,并且由于不确定XML关键字查询的每一个结果都对应一个概率值,所以用户通常希望得到前k个概率值最大的结果。不确定XML的Top-k关键字查询算法得到了广泛的关注。首先,已有的不确定XML关键字查询都是基于栈结构实现的,需要频繁的进栈、出栈操作以及频繁的字符串比较,时间效率低下。为了解决这一问题,本文提出一种基于动态Keyword数据仓的不确定XML关键字查询算法PrList。算法首先初始化动态Keyword数据仓,然后自底向上、自左向右遍历Keyword数据仓中的节点求解SLCA节点,不需要进出栈和字符串的比较。其次,目前不确定XML的Top-k关键字查询仅返回概率值排在前k的根节点,需要进一步的处理才能构建满足特定条件下的子树,时间效率低下。为了解决这一问题,本文定义了一种新的基于最小相关联通子树的Top-k查询语义SRCT-Top-k,SRCT-Top-k查询返回概率值排在前k的最小相关联通子树。为了便于处理SRCT-Top-k查询,对动态Keyword数据仓进行了扩展,形成扩展动态Keyword数据仓,然后基于扩展动态Keyword数据仓提出了PrListTop-k算法来处理SRCT-Top-k查询。PrListTop-k算法仅扫描一次扩展动态Keyword数据仓就能构建满足特定条件下的子树,并且制定的过滤策略可以大量地减少中间结果。本文进行了大量的对比实验。通过设定不同的查询条件,将提出的PrList算法与PrStack算法进行对比,并将提出的PrListTop-k算法与没有过滤策略的PrListTop-k-N算法进行对比。对最终的实验结果进行了详细的分析,证明了所提出的两种算法具有高效性。
其他文献
一、思维与数学思维1.思维心理学家们认为思维是指拥有意识的人脑认知事物本质与内在规律的过程.这也就意味着人在进行感知的基础上,对客观存在的事物有了感性的认识之后,然
该论文便是以克里尔兄弟的城市形态理论及其设计实践为对象的综述介绍和分析研究,并希望籍此探讨其思想和理论对于我们当前的城市建设可兹借鉴的原则和方法.论文共分为七个部
在这篇论文中,作者通过对城市规划体系、城市规划的法制和动作程序、城市建设用地的指标控制方法、城市设计对城市规划的影响、城市规划立法、城市规划的公众参与以及城市土
数学主要关注的就是相互联系的数与形之间的关系,因此数形结合的思想必然贯穿于整个高中数学教学的始终.在新课改的要求下,高中数学教师应当采用学生自主学习探究等教学形式,
随着社会国民经济快速发展,大城市商务旅行越来越繁荣,商务宾馆的建设也越来越多,北京作为现代化大都市商务宾馆比其他城市更为突出。大堂作为商务宾馆重要的接待和集散中心,是整
提到文科数学,似乎许多数学老师都犯愁,而且有相当一部分数学老师根本不愿意承担文科班的数学教学任务.带上2016届文科生数学已经近三个月的时间,近一段时间我似乎陷入了迷茫
运动休闲空间是为运动休闲活动提供的空间场所,而住宅小区内的户外运动休闲空间则是提供给小区居民最直接的活动场所,是小区户外公共空间的重要组成部分。在当今我国城市化进程
该文研究的重点是为了实现历史文化名城保护和创建现代化国际大都市的城市发展目标,北京旧城区城市公共开放空间应采取的保护和发展的规划设计对策.该文的研究方法主要是综合
2009年,美国发布了最新的高中数学教育大纲《高中数学的焦点:推理与意义建构》,明确了如何在高中数学教学课堂中培养学生的推理能力和意义构建技巧,帮助学生养成推理的习惯.
随着新课标教学的不断改革,高中数学在教学过程中要进行贴近生活实际的教学,不仅要加强学生对数学知识的掌握能力,还要提高学生社会生活实践能力.高中数学问题生活化教学,可