OnceDI中语义数据集成支持工具的设计与实现

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:shelley79
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机网络的迅速发展推动了信息化和全球化的进程。企业与企业之间,企业的各部门之间,信息交换越来越频繁。由于地理位置的分布性和所采用的技术的多样性,直接导致了数据资源的异构性,数据模式和数据表示的差异给数据集成造成了很大困难。   传统的数据集成研究,依赖模式映射和模式转换较好地解决了模式冲突问题。但由于信息内容的语义通常隐含于数据模式中,以应用逻辑来展现,缺乏数据语义的显式表达能力,这在很大程度上影响了数据集成的准确性。语义数据集成的主要任务,即是以一种逻辑的显式的方式来描述数据的语义,并在此基础上检测和解决语义冲突,提高数据集成的能力和质量。   本体是知识表示的重要支撑工具。基于本体的数据集成主要借助于本体来描述数据模式信息,通过定义共享词汇集来揭示数据模式的语义及其它的语义信息。与基于关系模式的数据集成相比较,它可以进一步丰富数据模式的语义表达能力,有效处理各种语义冲突。   本文以中科院软件所开发的数据集成中间件OnceDI为基础,针对语义数据集成中的关键问题展开研究,开发支持语义数据集成的工具软件。论文提出了一种自动的关系数据库到本体的转换方法,通过分析关系模式的主键、属性、引用关系、完整性约束和部分数据来创建本体,尽量保持了关系数据库的信息,并在构建的过程中,对信息进行初步的集成和分类。在此基础之上,我们对异构数据库集成中的语义冲突检测和解决方法进行了研究,该方法包括语义冲突的表示模型和基于该模型的冲突检测和解决算法两部分内容。最后,论文给出了OnceDI中语义数据集成支持工具的解决方案,并进行了设计与实现。系统主要分为模式的抽取转换和语义冲突的检测与解决两大模块,其中前者完成关系数据库到本体的转换,后者完成语义扩充并最终解决冲突。该支持工具有效的提高了OnceDI的数据集成质量。
其他文献
JNDI服务是Web应用服务器的核心支撑服务,在中间件系统平台中处于非常重要的地位。本文从分析Web应用服务器对于名字服务的需求和现有JNDI服务的不足入手,在J2EE1.4规范的基础
学位
A管理模式是我国较先进的企业管理思想,在很多企业得到了实施并取得良好效果。但管理过程中的数据搜集分析和过程流转等业务功能,必须依靠软件系统的支撑才能够取得实质效果。
学位
近年来,形式化方法——即在计算机系统和软件的规范、设计和构造中使用基于数学模型和离散数学的技术的工具的方法,被广泛应用于高等级安全操作系统的开发过程中。TCSEC的B2级
学位
科学数据库经过二十多年的发展,积累了大量的数据资源。随着网络技术的发展和科学研究的进步,科学数据库将成为科研工作的基础设施之一,并将成为未来科学研究必不可缺的资源。作
学位
在大脑接收的来自外部世界的感知信息中,80﹪以上是通过视觉系统进行加工处理的.最近二十多年来,视觉信息加工的机制是脑科学、神经生物学、认知心理学和计算机科学等学科研究
嵌入式技术作为计算机技术和电子通讯技术的交叉学科,其在科学研究、工程设计、军事技术等领域得到了广泛的应用。在一般情况下,嵌入式应用的执行都有着相当严格的时间限制,有些
学位
各种高科技领域的强劲需求不断推动着数据库规模的迅速膨胀,传统的集中式数据库系统已经难以满足这种数据密集型应用的需要,因此,开发高性能、低成本的并行数据库系统将有重大意
学位
伴随着计算技术的发展,在实际应用需求的推动下,数值计算得到了长足进步。数值软件尤其是并行数值软件是当前数值计算的关键环节。日益增多的大规模、复杂实际应用问题,对数值软
学位
XML(eXtensible Markup Language,可扩展标记语言)定义了一种数据格式,这种数据格式允许用户自己定义标记,来描述特定应用领域的数据,以这种格式描述的数据形成的文件称为XML
随着计算机技术的迅速发展和硬件水平的快速提升,尤其是近年来高性能计算机和并行技术的发展,气象、生态问题的高性能计算应用显得日益重要。本课题内容基于国家973项目“高性
学位