论文部分内容阅读
计算机网络的迅速发展推动了信息化和全球化的进程。企业与企业之间,企业的各部门之间,信息交换越来越频繁。由于地理位置的分布性和所采用的技术的多样性,直接导致了数据资源的异构性,数据模式和数据表示的差异给数据集成造成了很大困难。
传统的数据集成研究,依赖模式映射和模式转换较好地解决了模式冲突问题。但由于信息内容的语义通常隐含于数据模式中,以应用逻辑来展现,缺乏数据语义的显式表达能力,这在很大程度上影响了数据集成的准确性。语义数据集成的主要任务,即是以一种逻辑的显式的方式来描述数据的语义,并在此基础上检测和解决语义冲突,提高数据集成的能力和质量。
本体是知识表示的重要支撑工具。基于本体的数据集成主要借助于本体来描述数据模式信息,通过定义共享词汇集来揭示数据模式的语义及其它的语义信息。与基于关系模式的数据集成相比较,它可以进一步丰富数据模式的语义表达能力,有效处理各种语义冲突。
本文以中科院软件所开发的数据集成中间件OnceDI为基础,针对语义数据集成中的关键问题展开研究,开发支持语义数据集成的工具软件。论文提出了一种自动的关系数据库到本体的转换方法,通过分析关系模式的主键、属性、引用关系、完整性约束和部分数据来创建本体,尽量保持了关系数据库的信息,并在构建的过程中,对信息进行初步的集成和分类。在此基础之上,我们对异构数据库集成中的语义冲突检测和解决方法进行了研究,该方法包括语义冲突的表示模型和基于该模型的冲突检测和解决算法两部分内容。最后,论文给出了OnceDI中语义数据集成支持工具的解决方案,并进行了设计与实现。系统主要分为模式的抽取转换和语义冲突的检测与解决两大模块,其中前者完成关系数据库到本体的转换,后者完成语义扩充并最终解决冲突。该支持工具有效的提高了OnceDI的数据集成质量。