论文部分内容阅读
随着大量XML数据的出现,如何有效地存储、管理、共享和查询这些XML数据,就成为一个值得研究的重要课题。目前,XML数据管理技术是数据库领域的研究热点。本文对XML的数据共享与数据查询技术的一些关键技术进行了研究,包括XML索引、XML流数据查询执行器的增量维护、XML数据交换的模型。取得的成果体现在以下三个方面:1)在XML的发展过程中,如何有效的查询XML数据已成为一个研究热点。其中如何快速和有效的判断两元素是否具有祖先/后裔(ancestor/descendant)关系最为关键。目前已有的素数编码方法需要大量素数和很多大素数,为此,本文提出一种改进的素数编码方法-最多亲兄弟素数(Most Brothers Prime,简称MBPrime),该方法不必每个节点都使用新素数。MBPrime素数编码方法大大减少了素数的使用量,减少了所用的大素数,加快了XML查询的速度。2)提出了基于树型结构的XML查询增量维护算法TSQM(Tree Structure about Query Maintenace)。TSQM算法使用树型结构来表达Xpath查询的XML数据流之上持续查询执行器的增量维护方法,该方法使用树型结构表示”//”、“*”XML结点关系的合并,使用自动机表示状态转换。TSQM算法对XML树型结构进行动态维护,避免了在没有DTD情况下出现的环形结构的复杂操作,减少了维护的时间和状态转换的数量。TSQM算法能够以有限转换路径为代价,有效完成XML数据流持续查询执行器的动态维护,减少了增量维护的时间,和状态转换数量。3)提出了基于XML技术的信息交换模型,采用XML文档作为底层的信息交换载体,建立了Internet/Intranet环境下的信息集成交换平台,开发实现了相应的软件构件,为底层本地实现异构数据库系统间信息的集成与共享提供了一种有力的方法和手段。并在重大环境污染事故危险源管理系统中加以实现,实现了各级环保部门之间的XML数据交换,同时对XML在企业间信息交换的工作机理和应用模式进行了探讨。