基于语义相似度的RDF本体查询松弛方法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:leoki111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义Web是下一代Web的发展方向,是当前互联网的延伸,其目标是使Web上的信息能够被机器理解,从而可以更加高效地检索信息。RDF(Resource Description Framework,资源描述框架)是一个通用的元数据模型标准,它使得语义Web上的语义检索成为可能。随着RDF的广泛应用,RDF本体在规模及复杂度上迅速增加,对RDF本体查询的难度也越来越大。在RDF本体查询中,一方面,当用户明确自己的查询意图但是对本体的结构和内容不太了解时可能会出现返回结果为空或少量的情况;另一方面,经过查询松弛后会出现返回大量结果的情况,其中会有一部分结果与初始查询在语义上偏离较远,此时用户又希望系统在返回查询结果时能够返回与初始查询在语义上相关的查询结果。针对以上两种情况,本文提出了基于语义相似度的RDF本体查询松弛方法。本文针对返回结果为空或少量的情况,提出了RDF查询松弛的方法,通过RDFS的蕴含规则对三元组模型进行松弛从而得到更多的查询结果。针对要求返回与初始查询在语义上相近的结果的情况,提出了面向RDF的语义相似度的概念,通过语义相似度的计算,从而在查询松弛得到的结果中选择与初始查询在语义上相近的结果。随后在上面提出的查询松弛策略以及语义相似度的基础上,给出了查询松弛算法,并在最后实现了一个简单的原型系统,其中RDF本体的存储使用支持SPARQL查询语言的Jena SDB.实验表明,本文提出的基于语义相似度的RDF本体查询松弛方法具有可行性,并且通过与现有RDF查询松弛方法进行比较,验证了本文提出的方法在查询响应时间以及查全率方面具有的优越性。
其他文献
随着网络的飞速发展和人们需求的快速增长,许多网络商店如卓越、当当网等应运而生。网上购物不但提供了各种各样便宜的商品,并且没有营业时间和空间的限制。用户可以购买任何
随着计算机和互联网等新兴媒体的迅猛发展,如何从海量的网页文档中及时准确地找到需要的信息已经成为一个亟待解决的问题,传统搜索引擎在性能和用户体验上受到了较大的挑战,
随着互联网技术的发展,博客作为Web2.0的典型代表,已经成为传递资讯、表达意见,将个人空间和社会空间良好结合在一起的传播平台,在人们的政治、经济、文化生活中,扮演着重要
无线传感器网络一般具有大规模、自组织、随机部署、环境复杂、传感器节点资源有限、网络拓扑经常发生变化的特点。这些特点使拓扑分割成为挑战性研究课题。本文从网络拓扑分
互联网的飞速发展改变着人们的生活和工作方式,随之而来的是层出不穷各种各样的新的需求。为了应对这种变化并解决IP地址资源匮乏的问题,下一代互联网(Next Generation Inter
随着Web技术及其应用的快速发展,XML作为Web上信息表示和数据交换的一种数据格式,在电子数据交换、科学数据表示、电子商务和搜索引擎等许多重要领域得到广泛的应用,Web上已经积
随着信息技术的不断发展和计算机不断普及,个人数据信息急剧膨胀,Web也日益成为一个巨大的信息共享平台,各种数据随之呈现出一些新的特性:一是增长的快速性;二是数据共享性;三是
不可能差分攻击是一种利用差分的性质,攻击分组加密算法的密码分析方法。作为差分攻击的一个重要变种,该方法以其简单的的攻击流程以及强大的攻击能力,引起了密码设计与分析
僵尸网络已经成为了互联网上最严重的威胁之一,检测和抵抗僵尸网络是现在的热点问题。目前僵尸网络的检测方法大部分是基于网络行为和特征,这种方法容易受到僵尸网络结构的影
随着网络技术和应用的飞速发展,互联网已经渗透到人们的工作、学习和生活等各个方面,人们对通信的需求也日益增长。在下一代互联网(Next Generation Internet, NGI)中,随时随