eXist原生数据库结构连接算法与加密管理机制的研究与改进

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:guofeng7303
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web技术的发展和普及,以及XML数据作为Web信息传播、存储媒介的优点逐渐深入人心,专为处理XML数据的原生XML数据库日益受到重视,有着非常光明的应用前景。eXist数据库可以说是当今最流行的开源原生XML数据库,已作为商用数据库运行在包括嵌入式在内的大多数平台上,处理大量真实的商业数据。相较同类型数据库,eXist数据库文字检索效率更高,数据库体系结构更完整,外部程序访问接口更丰富。但与成熟的关系型数据库相比,eXist数据库在查询效率、数据加密管理等方面仍有较大差距。本文对eXist数据库查询策略中的结构连接算法和数据管理中的加密机制作了详细的研究。对结构连接算法的研究重点放在以下两问题:如何避免eXist数据库现有结构连接算法反复遍历参与结构连接的节点序列,以及如何通过节点编码已有性质减少计算和判断匹配的次数。在加密机制方面,主要研究了如何提供一种具有可扩展性的加密管理机制,以便用户能将所需的加密算法方便地添加到eXist数据库中,而不会影响数据库现有设计。在对上述两方面进行研究的基础上,本文设计并实现了基于栈的快速定位结构连接算法——FL_Stack和模块化插件式的加密管理机制。对于eXist数据库查询策略的核心步骤——结构连接操作,本文首先借鉴了现有结构连接算法研究领域中已提出的基于栈的归并连接算法(该算法更多的是提供了一种算法思想,但并非结合了特定数据库的特性而提出的适合该数据库的最优算法,因此该算法尚未被任何真实的数据库采用),在eXist数据库现有的结构连接算法基础上,提出了eXist数据库基于栈的结构连接算法——Base_Stack,避免了对参与结构连接节点序列的反复遍历。山于Base_Stack算法在结构连接过程中,仍需——计算并判断所有明显的连续不匹配的祖先后代节点对,才能找到下一个可能匹配的祖先后代节点对,本文提出并实现了基于栈的快速定位结构连接匹配算法——FL_Stack算法。FL_Stack算法借助eXist数据库编码特性,定义了最小差异前缀,分别用祖先节点编码和最小差异前缀作为定位标准,跳过结构连接操作中明显不匹配的后代和祖先序列,从而避免了对节点关系的逐一计算和判断,进一步缩短了结构连接时间。FL_Stack算法不仅可用在eXist数据库中,其思想还能用于其他需要进行结构连接操作的应用中。然后,本文用数学方法,从栈的设计和快速定位两方面证明了FL_Stack算法的正确性。此外,本文在合成的和真实的XML数据集上完成了多种实验设计,对eXist数据库现有结构连接算法和FL_Stack算法进行了大量的较全面的实验比较,验证了FL_Stack算法在时间效率上的优势。对于数据安全管理中起到重要作用的加密机制,eXist数据库目前只提供了MD5加密算法,而且不支持其他加密算法的扩展。本文通过定义加密算法公共接口和与之对应的加密算法管理模块,设计并实现了能将加密算法模块化地作为插件添加到数据库中的加密管理机制,提高了eXist数据库数据加密管理方面的可扩展性。最后,以添加一个新的加密算法为例,描述了本文加密管理机制的使用方法,并通过加密结果对比,验证了利用该加密管理机制添加的新加密算法能成功地使用在eXist数据库中的结论。
其他文献
随着语义网络的迅速成长,涌现和积聚了很多语义信息。然而,因为语义网络分布的自然性,语义网络上的数据不可避免地来自于不同的本体。本体之间的信息加工处理不可能脱离了它
网格服务是一种基于WSDL定义的Web服务,而且满足一系列面向客户端交互的相关接口定义和行为标准。随着网格服务及应用的复杂性不断提高,需要为其引入工作流,可以通过工作流将
在深入研究现有数据库同步模型的基础上,为了提高系统的跨平台能力,便于中小企业信息化平台建设,本文提出了一种基于JMS与Web Service构数据库同步的架构方案。利用JMS实现了
随着互联网的飞速发展,多媒体数字文本在传播过程中导致的版权纠纷正日益成为一个亟待解决的难题,为了能够有效地保护作者版权,文本数字水印技术应运而生。传统的文本数字水
WSN成为进入2000年以来公认的新兴前沿热点研究领域,并被认为是将对21世纪产生巨大影响力的技术之一。然而,在设计、开发WSN协议和应用的过程中,面临着一系列挑战性问题。首
图像融合技术是将多个传感器收集的关于同一目标的多幅图像经过图像处理,提取各幅源图像的数据,融合在同一图像中。图像融合能使融合后的图像比融合前的任何一幅源图像更容易
高校信息系统为建设信息化校园提供了有力的保障,但是,传统的高校信息系统存在着的许多弊端。首先,信息分散,应用系统分散等问题在高校普遍存在,缺乏一个统一的综合的信息管
随着社会的进步和信息技术的发展,身份识别技术日新月异,利用指纹、语音、人脸等进行身份识别也逐渐进入了实用阶段。本论文尝试在上海交通大学E-Learning实验室的各种现有设
IMS是3G系统中核心网的一部分,它由SIP协议提供的会话发起能力建立起端到端的会话,并获得所需要的服务质量。IMS解决了目前软交换技术还无法解决的问题,同时成为固定和移动网
随着国家交通运输体系的不断完善,对高速公路系统监控的要求越来越高。目前高速公路监控系统的客户端一般采用基于地理信息系统的C/S模式。随着Web应用的日益广泛和Web开发技