基于XML的半结构化数据存储技术研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:qinpeizhen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的迅速发展,使得网上数据不断激增。这些数据缺乏统一的、固定的模式,而且往往是不规则、经常变化的。因此,半结构化数据模型应运而生,它是介于完全结构化数据和无结构化数据之间的一种数据类型。要想对这种半结构化数据进行有效的管理是十分困难的。如何对半结构化数据进行有效的管理成为研究的热点。XML技术的出现,推动了半结构化数据的发展。XML数据是一种自描述的半结构化数据,利用XML文档来管理半结构化数据是一种有效的途径。由于关系数据库在各方面都相对成熟和稳定,因而采用关系数据库对XML数据进行存储和操作,将半结构化转化为结构化的数据,具有重大的理论意义和实用价值。论文的研究从分析半结构化数据和XML相关技术出发,旨在设计一种实现半结构化数据到XML数据的映射算法和一种半结构化数据的存储结构实现XML数据到关系数据库的映射。论文深入探讨了半结构化数据的定义及特点,分析半结构化数据的模式描述形式以及半结构化数据的模式抽取技术,详细介绍了XML和数据库的转换技术。目前最具有代表性的半结构化数据的模式描述形式是OEM模型,它是一种带有嵌套和标记的自描述性有向图。论文采用邻接表表示法实现图的存储,并给出各对象相应的存储结构定义。通过对OEM模型图的遍历,把OEM模型所对应的图结构,转换为相应的XML文档,生成XML数据,实现半结构化数据向XML文档的映射。基于有向图的深度优先遍历思想,给出一个转换算法实现了XML数据的生成。转换得到的XML数据是一种无模式的数据文档,而且XML文档中不存在属性的成分,只有元素成分的存在。基于所生成的XML文档,通过分析XML文档和数据库技术的相互映射方法,采用一种基于前缀编码的模型映射方法,实现XML数掘和数据库的映射。论文最后给出了一个简单的半结构化电子病历数据,实现了半结构化数据向关系数据库的映射转换,并给出了几个典型的XML查询实例。真正的通过XML技术和现有关系数据库技术相联系,实现“以关系数据库为存储手段,以XML技术为交换载体”的数据管理模式。
其他文献
近年来由于农业信息化的迫切需要,关于农作物病害识别的研究引起了人们的重视,对于常见的农作物病害识别问题很多学者从多个角度、利用多种方法进行了有效识别,但想要应用于
随着市场竞争的日趋激烈,每个企业都在寻求更好的生产与运作管理方案,以提高企业的生产、经营和管理效率,从而提高企业的核心竞争优势。生产与运作管理的核心是车间调度问题能否
道路空间中连续最近邻居问题(CKNN)是近年来研究领域中的热点问题,并且被广泛地应用在地理信息系统中。CKNN的初衷是找到待查询路径上任意查询点的最近邻居集,其结果是待查询
随着网络技术的不断发展,基于网络的E-Learning正在改变着人们学习知识的方式,越来越多的学员渴望通过更加个性化和智能化的方式来获取知识。在E-Learning的环境中,随着教学
随着网络的飞速发展,Web资源以指数级的速度增长,人们从互联网上可以获取的资料变得越来越多。同时,互联网也以其巨大的信息量给人们带来了前所未有的冲击。在用户利用Web搜
随着Internet的发展和普及利用,用户可以从网络上获取丰富的、最新的信息,同时,由于网络信息的开放性,用户不可避免地接触到色情的、种族主义的、暴力的、封建迷信或有明显意
企业级系统在满足人们不断增加的需求的过程中,变得日益庞大,而系统维护工作和进一步开发变得越来越艰难。重构为解决这一问题提供了指导意见。自动化是重构活动的一个趋势。
随着晶体管工艺尺寸的下降,数字电路的集成度日趋上升,在满足高性能的同时,老化成为影响电路可靠度的主导因素之一。尤其在电路生命周期的后半阶段,老化会导致电路发生时序违
本文结合两个与企业合作的工程项目:“天津移动告警关联分析系统(TACAS)”和某运营商的NGN业务网络中的“通话管理能力集”,对告警关联挖掘技术和Webservice分布式技术在网络
目标跟踪的应用领域诸多,如人机交互、安全检测、军事视觉制导等。由于外界环境、目标本身、算法的时间性能和准确度等的影响,限制了很多目标跟踪算法的应用场景。因此,构建