论文部分内容阅读
近年来,伴随着互联网的发展,信息来源种类的增多,信息复杂性的增加,一方面,半结构化数据的大量应用使得传统的数据存储和交换方式已经不能够满足实际应用和研究的需要,XML作为半结构化数据的存储标准,正在被广泛的应用;另一方面,随着XML逐渐成为WEB数据交换的标准,越来越多的数据集成系统通过用XML包装,于是,不同数据源的集成转化为异构XML数据源的集成问题。这使得异构XML数据源的集成研究成为新的热点。
本体是共享概念模型的明确的形式化规范说明,它能够有效地表达特定领域内的通用知识,很适合作为信息集成系统的全局模式,因此,本文提出了一种基于本体的异构XML数据源的集成系统。该系统利用本体作为全局模式对异构XML数据源的语义集成,通过查询绑定算法,查询分解算法,查询转换算法处理用户基于全局本体的查询,创建各个XML数据源上与其语义一致的XQuery查询,最后整合查询结果返回给用户。同时,系统给出了解决当前同类的集成系统尚未解决的局部数据源间进行连接,合并操作中由于局部数据源间的异构而引发的冲突问题的方案。除此之外,针对当前的同类系统提供给用户的本体查询语言复杂,不方便用户查询的缺点,为用户提供了局部查询接口,使用户能够在任一XML数据源上用流行的标准的XQuery语言进行查询,系统将会把所有XML数据源与用户查询语义一致的结果集返回给用户。