论文部分内容阅读
随着我国信息化建设的发展,各行各业建立起各种管理信息系统,基本实现了内部信息的高效管理。但是由于早期系统在建设时缺乏统一规划和技术标准,使得这些系统中对数据的描述千差万别,数据环境有很大差异。它们构成了一个巨大而复杂的异构数据环境,数据之间彼此分离,难以沟通,形成了无数的“信息孤岛”。如何减少“信息孤岛”,充分利用已有的信息资源,已经成为各行业信息化建设急需解决的共同问题。这需要应用信息集成技术对异构数据源进行科学有效的集成,屏蔽它们的分布性和异构性,向用户提供一致的数据界面和高效、简便的信息服务。信息集成技术成为当今信息技术发展的趋势之一。
由于大多数管理信息系统的数据都是结构化的存储模式,因此异构数据库集成是信息集成的基础和前提。它涉及人工智能、高级数据库与知识库系统、分布式信息系统、等多个领域。
本文对信息集成系统的研究现状和发展趋势进行了深入的分析和探讨,并围绕异构数据库信息集成,对异构数据库复制技术、异构数据库信息集成架构、以及异构数据库信息集成中的冲突发现和解决等问题展开研究。
首先综合分析了信息集成技术的研究现状和发展趋势,对信息集成的两种方法:物化方法和虚拟方法做了分析和比较,详细说明了基于数据仓库和基于Mediator/Wrapper的信息集成过程。其次针对信息集成全局数据模型物化方法,本文提出了应用异构数据库复制技术构建全局数据模型,在各个子系统与全局数据模型间进行数据转换的方法,提出一个“基于SQL重现法”的异构数据库复制技术。然后针对信息集成过程中不可避免的数据冲突问题进行研究,给出了基于本体的语义冲突解决算法。最后对研究工作进行了总结和展望。
论文在以下方面作了有益的探索和创新性工作。
(1)对异构数据库复制技术进行深入分析,提出了一种基于“SQL重现法”的异构数据库复制技术。该技术针对已有的异构数据库复制技术在屏蔽异构性方面的缺陷,将日志法和触发器法等多种复制方法相结合,并利用SQL语句记录源端数据的净变化,同时把产生该变化的SQL语句在目的端重现的方法,实现不同数据库间的数据复制。由于SQL的通用性,使之能够成为异构数据库的跨平台复制工具。这里充分考虑了异构数据库复制的平台无关性,可以为用户提供多快捷可靠的复制方法。
(2)从软件工程的角度,提出一种基于异构数据库复制技术的开放式信息集成架构。应用这种集成架构,能够缩短信息集成系统的开发周期,提高运行效率。
(3)本文提出按照信息集成过程进行数据冲突分类的方法。把数据冲突分为概念集成时的语义冲突、模式集成时的模式冲突和实例集成时的实例冲突。并对各种冲突进行详细的分析研究,提出冲突的综合解决策略。给出基于属性空间的模式结构冲突解决算法,把模式结构冲突的解决转换为可度量的矢量空间求解。同时针对语义冲突,本文应用本体技术,提出一个新的综合语义相似度度量改进算法。
(4)把本文研究的成果应用到数字校园的信息集成建设实践中。进行了原型系统CIS(CentralInformationSystem)的开发。通过把本文的研究成果在数字校园领域进行技术实现,以验证本文研究成果的正确性和实用性。
本文的研究对于推动我国高校信息化建设和提高我国信息集成领域的理论和应用水平有着积极的意义。