【摘 要】
:
XML数据查询时经常使用结构化查询语言XPath和XQuery,因为XML结构化查询方法可以返回的查询结果更加精确。但该查询方法要依赖复杂的查询语言和精确的查询表达式,而且还需要
论文部分内容阅读
XML数据查询时经常使用结构化查询语言XPath和XQuery,因为XML结构化查询方法可以返回的查询结果更加精确。但该查询方法要依赖复杂的查询语言和精确的查询表达式,而且还需要查询用户了解XML文档的底层结构特征。作为一种简单、实用、高效的信息获取方式,面向XML数据的关键字搜索技术应运而生。与传统的XML结构化查询方法相比,XML关键字查询不仅为用户提供了类似于搜索引擎的简单查询接口,而且查询过程比较简单、灵活,是一种友好、便捷的XML数据查询方式。XML关键字查询时,用户只需输入对应的关键字即可获取目标XML数据片段。XML关键字查询中几个简单的查询关键字不足以表达用户的查询意图,针对关键字语义信息模糊性的特点,本文选择为关键字设置权重值来体现用户的查询意图。本文为关键字设置权重值并结合权重关系树中节点之间的结构关系提出了一种新的XML结果排序方法,在该排序方法中首先确定查询关键字的权重值,根据关键字的权重值为权重关系树中的关键字节点设定权重值,进而根据节点之间的结构关系设定其它非关键字节点的权重值,最后根据权重关系树中节点的权重值和节点之间的结构关系计算每个SLCA的重要程度,并以SLCA的重要程度为依据对XML关键字查询结果排序。除了基于关键字权重的XML查询结果排序方法外,查询结果排序问题还应该考虑到用户对不同内容的查询偏好程度,通过收集用户以前的查询历史记录可以推测用户的查询偏好,分析用户的查询历史记录并计算查询结果片段的新鲜度和兴趣度,并根据归一化处理后结果片段的新鲜度和兴趣度计算每个查询结果的重要程度,然后根据查询结果的重要程度对其进行排序,最终返回给用户偏好程度比较高并且有序的查询结果。为了验证本文提出的排序算法的有效性,设计并实现了XML关键字查询系统,在该系统中对XML关键字查询返回的结果分别用两种不同的排序算法实验测试。分别在两个不同的数据集上对两种XML查询结果排序方法进行实验,并对实验结果进行对比分析。本次实验从查询准确率和排序效率方面验证了排序算法的有效性。
其他文献
为了防治病虫草害,提高农作物的产量和品质,农业生产者每年使用大量的农药,其中的大部分都直接进入到环境中,对淡水和土壤造成严重污染。如何高效地降解去除淡水中的农药残留对环境具有重要的意义。化学氧化法主要是通过投加氧化剂使水体中的农药残留与之发生化学反应、改变农药的性质,从而降解去除农药残留的方法。本论文开展了5类12种农药分别与三种氧化剂NaClO、KMnO_4、K_2FeO_4在不同浓度下的反应活
近十年来,人们对复值神经网络的研究日益增多.复值神经网络在复杂信号处理等方面,具有比实值神经网络更加优越的特性.复值系统的状态变量、激活函数、连接权值都是在复数域上进行定义的,分析方法与实值系统有很大的不同,因此对于复值神经网络的研究是有意义的.本文主要研究复值系统,建立两种不同的神经网络模型.利用Lyapunov函数理论、Gronwall-Bellman引理、复变函数理论和不等式技术,针对具体的
稻谷是我国主要的粮食作物,在储藏期间易发生陈化,造成品质劣变。红外辐射(Infrared radiation,IR)可以从源头控制稻谷安全储藏的不利因素,提高粮食储藏稳定性。脂类物质与稻谷品质劣变的关系最为密切,但红外辐射对稻谷脂质代谢的影响尚不清楚,导致红外辐射技术用于阻控储藏稻谷品质劣变存在理论瓶颈。本文以“京优一号”稻谷为原料,采用红外辐射干燥技术处理稻谷,并以传统干燥技术自然通风干燥(Am
根结线虫(Root-knot Nematodes)作为猕猴桃根部的重要病原物,其为害已成为猕猴桃产业发展的制约因素之一。目前猕猴桃根结线虫病的防治以化学防治为主,但化学农药长期使用常造成病害抗性产生、环境污染和农药残留等诸多问题。本研究通过鉴定猕猴桃根结线虫侵染根部产生的病害特征,同时观察病原线虫形态并辅以分子生物学手段明确其种类;使用植物乙醇粗提物对根结线虫进行毒力测定,筛选出对线虫活性较好的粗
煤炭作为一种不可再生的资源,其高效利用依赖于对煤炭的有效洗选加工。浮选是对-0.5mm粒级煤泥进行分选的主要方法,煤油在我国洗煤厂广泛使用,主要用作煤泥浮选捕收剂,工业实践中经常存在精煤回收率不高、药剂选择性差、药耗偏高等问题,对浮选效果有较大影响。论文内容主要基于煤油及其复配药剂磁化处理后对不同性质煤泥的浮选提效研究。磁化设备为自行设计和组装的可调控电磁螺线管磁场,将煤油、煤油与表面活性剂等的复
C-H键是构成有机化合物最基本、最重要的化学键,具有键长较短,解离能较高的特点,是一种惰性化学键。在过去的研究中,选择性地控制不同C-H键反应位点是化学研究者面临的一个难点。近年来,化学工作者将C-H键的断裂同烯烃的双官能团化反应联系起来,通过氧化切断C-H键形成碳自由基,然后与烯烃加成实现烯烃的官能团化反应已有了较深入的研究。在过去的几十年中,过渡金属包括钯、铑、金、铱、铂等催化C-H氧化自由基
随着分布式计算、网格计算、效用计算等技术的发展,研究学者们融合了这些传统计算机和网络技术的优点,从而提出了一种更高级的计算方式—云计算,这是互联网领域的又一巨变,从
近十年来,带有分段常数变元的广义型神经网络已被许多研究者们进行了广泛的研究.与传统的神经网络所不同的是,由于导向函数的存在,使得这类神经网络变成了混合型神经网络.也就是说,随着时间的演化,这类神经网络不仅是超前的,也是延迟的.从这类神经网络的外观形式上来看,其导向函数影响整个网络演化,所以在分析该神经网络的动力学特性之前,最重要的一个环节是找到其变分项与当前项之间的关系,以此来度量变分项,这是解决
呼吸运动是自然界生物体最常见的一项生命活动,它是所有生物体用来维持生命体征的重要保障,同时也具有丰富的动力学行为。在人和其他哺乳动物延髓头端处有一个称为前包钦格复合体(pre-B(?)tzinger complex,pre-BotC)的区域,其中存在一类特殊的吸气神经元,研究发现这类神经元的存在与呼吸节律的产生密不可分。理论和实验研究发现呼吸系统模型可以产生依赖于持续钠电流的胞体簇放电、依赖于钙激
中国改革开放近40年来,经济、政治、文化等发展取得了巨大的成就,全球影响力也正在进一步扩大,但是相比于中国的综合实力,中国的话语权还十分薄弱,在国际上充斥着诸如“中国