基于本体的异构数据源集成系统模型及其查询处理

来源 :山东大学 | 被引量 : 0次 | 上传用户:wryktt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web提供了一个极其丰富而有价值的信息资源库。如何从Web数据源中获取并提供给用户符合需要的Web信息这是一个具有重要意义的理论和实际应用课题。Web上的数据具有半结构性、异构性和分布性等特点,使用传统的数据库技术来存储和查询Web上的所有类型的数据是十分困难的。这篇文章主要研究如何实现Web上异构数据源的集成和有效的查询。 每个Web站点中的信息处于某特定语义背景当中,这个背景中的特定知识蕴涵在Web信息当中,与Web信息一起构成了Web信息的语义。由于Web信息的分布性,Web信息的语义可能存在异构问题。本文在分析Web信息特点和当前Web信息集成方法的基础上,对如何在语义层上实现Web信息的集成,以及如何进行查询处理进行了研究。这些研究包括了基于本体的异构数据源集成系统模型的提出,查询的重写,查询的分解及查询的优化等内容,所做的工作和创新点主要体现在以下几个方面: 1.提出了一种通用的基于本体的异构数据源集成系统模型OBISUA(Ontology-Based Integration System Universal Architecture)。该模型通过引入本体来解决各数据源在语义层上的异构,为用户提供一个语义统一的接口,随时随地提供对数据统一、透明的访问,从而实现各异构数据源中信息的共享。 2.在模型的查询处理部分提出了两个查询重写算法。算法一将用户提出的对全局本体的查询转化为对局部本体的查询,算法二将对局部本体的查询转化为对数据源的查询。用RDFS来描述本体,对全局本体的查询使用RDQL语言,对数据源的查询使用XQuery语言。 3.提出了基于缓存的查询优化策略。由于对WWW上的数据源检索速度慢,每次从数据源检索的效率太低,为了提高全局查询的速度,引入缓存将查询结果存放于缓存中,用LRU算法淘汰最近不常用的查询结果。为了判断查询结果是否包含的缓存中,提出了“缓存入口”的概念,另外在判断两个查询是否具有包含关系时引入了“查询关系四元组”的概念。数据缓存可以大大降低对数据源处理能力的压力和对网络的压力。
其他文献
目前,主流的数据库系统有Oracle、SQL Server、DB2、MySQL、Sybase、 Interbase等,运行在windows、Unix、Linux、Mac等系统上,这些数据库系统占据关系数据库市场的90%以上。
近几年,随着通信和信息技术的高速发展和以智能手机为代表的移动设备的普及,移动支付产业应运而生。移动支付的广泛应用可以加快传统消费流程的升级,方便人们的日常生活,移动
以往和现有的数据库加密方法基本上都是面向数据值的。如:基于文件的数据库加密方法、基于记录的数据库加密方法、基于字段的数据库加密方法、以及面向数值加密的各种改进和
蜜罐是一种资源,其价值体现在被探测、攻击或损害,它能够转移攻击者视线,使之远离有价值的主机,对于新型的攻击和探测提供早期预警,并能够对收集到的攻击信息事后进行深入分析,是网
近年来,中医舌诊因其简单有效等特点,在国内外得到了越来越多的认可和应用,同时,随着现代科学技术的发展,将图像处理和模式识别等计算机技术与传统中医舌诊相结合,以使中医舌
随着信息化进程的加快,信息安全在各个行业显得尤为重要,而身份认证则是保证信息安全的重要手段。利用建立在Public Key Infrastructure(公钥基础设施)上的数字证书把信息进
随着计算机网络技术的发展和数字化技术的不断成熟,使得通过互联网发布和获取图像、语音、视频等电子数据更加便利,但随之而来的副作用也十分明显,比如篡改和非法传播变得非常容
无线局域网是计算机网络与无线通信技术相结合的产物。从专业角度讲,无线局域网利用了无线多址信道的一种有效方法来支持计算机之间的通信,并为通信的移动化、个性化和多媒体
随着Internet/Intranet的出现,计算机及其应用领域正发生着深刻的革命,计算机的应用正向着协同工作的方向发展。以此同时,分布式处理技术(CORBA,WWW,OLE,JAVA)日益成熟。在这
移动自组网是一组带有无线收发装置的移动节点组成的一种多跳的无线网络。将组播技术的有效性与移动自组网的特殊优势相结合,在移动自组网环境下开发基于群组合作的组播应用