基于ELCA语义的XML关键字查询算法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:wujian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可扩展标记语言XML是网络数据存储和交换的一种重要的标准。在RSS等新型网络应用中,使用XML作为数据表示语言,用户通过关键字来表达查询需求,应用系统获取符合用户查询要求的XML数据片段,并作为结果返回给用户。关键字查询的优点是可以方便表达用户的查询意图,因此被集成在许多应用程序中。  XML关键字查询技术最重要的两个方面是查询语义的有效性和查询处理算法的高效性。查询语义和查询处理算法关注的核心是如何快速让用户得到符合其查询意图的结果。特别是在需要为大量用户提供反馈的网络应用中,查询语义的有效性和查询算法的高效性就成为XML关键字查询可行性的两个关键因素。  针对现有研究中公共祖先重复问题,关键字二义性问题和结果排序问题。本文进行深入研究,主要的工作如下:  1.基于Dewey编码的构想,本文采用了一种新颖的双指标索引法-路径内容索引,对PCID算法进行了改进,研究了一种新算法--PCRK算法。路径内容索引算法采用了局部顺序编码来保存路径信息,占用的空间很少,同时它因不需要额外的存储,这样就减少了存储DeweyID路径信息的索引空间,解决了公共祖先重复问题和PCID方法中结果排序的问题,实验结果证明了该方法的有效性;  2.实现查询结果的有效性与相关性是XML关键字搜索中最关键的一部分,本文在现有研究的基础上,根据双重索引在现有的算法基础上进行改进,研究了一种新颖的TDF算法,该算法在XML数据库上建立两个索引来进行关键字搜索,解决了关键字的二义性和查询结果排序问题,并通过实验对该方法的有效性进行了验证。
其他文献
目前,全球移动通信市场已进入3G时代,各种基于3G网络的新业务层出不穷,而以手机电视、移动视频电话、视频短消息等为代表的移动视频业务无疑是其中最具发展前景的业务之一。移动
成功的特征造型系统,在很大程度上取决于是否能够为用户提供友好的方式来指定和改变特征模型。指定和改变特征模型往往是通过参数得以实现。改变参数的值是一种经常、反复的
软件工程的总目标是充分利用有限的人力、物力和财力,高效率、高质量地完成软件开发项目。随着软件不断产业化地发展,软件产品的复杂度不断增加,用户对软件的质量要求也越来越高
数据挖掘的目的是从大量数据库中发现人们感兴趣的、隐藏的、先前未知的知识。在实践中经常为了考察某个效果与某些因素之间的关联而进行相关的测量实验,得到一些离散的效果
随着网络技术的迅猛发展,信息处理成为人们获取有用信息不可缺少的工具。文本分类是中文信息处理的一个重要的研究领域。目标是在分析文本内容的基础上,给文本分配一个或多个
随着因特网资源的不断丰富,以及因特网应用的进一步广泛,人们希望不论何时、何地都能够高速、准确地接入因特网,无线因特网便应运而生。未来的无线因特网将是各种异构网络融合的
人工神经网络系统理论与应用研究是近年来得到迅速发展的一个国际前沿课题,它的发展涉及到众多的领域。自从20世纪90年代末以来,神经网络在过程工业领域,特别是在过程预测、过程
纹理分析在遥感、医学图像处理、计算机视觉及基于纹理的按图像内容检索等许多应用领域中具有重要意义。小波变换在信号与图像分析、地球物理信号处理,计算机视觉与编码及语
随着虚拟现实技术的广泛应用,人们对虚拟场景的复杂度和真实感要求越来越高,不仅要生成高度真实的复杂虚拟环境,而且用户要和虚拟环境进行互动,增强交互性和沉浸感。 基于几何
经过大量的研究发现,许多现实系统都可以用一个复杂网络来描述。这些复杂网络具有一些相同的特征,如网络平均路径长度较小、聚类系数较大、节点度分度服从幂律分布、小世界以