基于RDF的语义本体建模

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:liyan2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代电子计算机与通信技术的应用和发展,极大地促进了世界范围内人类知识的传播和文化的交流。特别是Internet的产生和发展,使全人类的交流更加方便和快捷。WWW(World Wide Web)作为全球性的网络信息系统,极大促进了Internet之上的全球信息传播。  然而,在伴随着Web成功的同时,呈指数级增长的海量信息使得来自各领域的用户对信息的查找、访问、表示以及维护变得越来越困难起来。“丰富的数据和贫乏的知识”问题越来越突出,主要的原因是目前的Web对信息的表示主要是“呈现”式的,大量的信息以自然语言、图片等方式罗列出来,使人淹没于知识的辨别、提取等繁杂的劳动中。对于目前Web上的信息,计算机只能从格式上来处理和验证,并不能处理知识级别的问题。  从目前情况看,Internet要想完全发挥其威力,不仅在于更快的处理器和更多的带宽,还在于建立一种更有利于交流与对话的机制,排除一切平台和语言的分歧,以自由、平等、开放的原则,以人类对现实世界的一致理解为基础,为全人类提供一种全新的高质量的信息服务。  在Internet互联网发展过程中,取得成功的最重要因素之一就是建立了一套广泛的标准,保证了在不同层次上的互操作能力。有三大技术起了决定性的作用:第一是分组交换技术和中介信息处理器(Interface MessageProcessor)的发明,使Internet的前身ARPANet(AdvancedResearch ProjectsAgency Network)网得以诞生,互联在技术上成为可能。第二是TCP/IP协议的提出与实施,使ARPANet扩展延伸,数据传输畅通无阻。第三是HTML,XML等数据表示标准的出现,使得Web成为一个全球最大的信息资源利用系统。可以看出,分组交换技术和中介信息处理器的发明使得信息交换在物理层的扩展成为了可能;TCP/IP,HTIP,FTP等协议保证了不同信息资源在网络上的通信;而在此之上的HTML,XML等Web语言在语法上统一了网上信息的表示形式和数据结构。  但是,仅依靠一种统一Web语言从语法上来实现信息的交换和共享还是不够的。例如,两个应用系统都采用XML作为信息交换的格式,但怎么能保证它们表述的是同一个意思?标记语言中一个元素和其子元素的关系,是超类与子类的关系还是组成关系?计算机能够区分吗?与“机器可读”相比,“机器可理解”是必要的和重要的。这就需要一种机制,使得计算机不但是能读取数据,还要能理解和区分数据的语义,实现Web信息语义层次上的互操作性。  语义Web就是在此背景下提出来的。语义Web的思想就是利用元数据(metadata语言对Web信息资源的内容进行语义上的描述,从而使计算机能够利用这些语义信息对信息资源的内容进行理解和处理,并在此基础上,实现更高层的、基于知识的智能应用。可以看出,这里所指的“语义”不同于语义学中的定义。从语义学的角度来讲,语义是语言形式表达的内容,语义是思维的体现者,是客观事物在人们头脑中的反映,是人们交际过程中的中心所在。从计算机科学的信息模型的角度来讲,语义是构建在一定的语法上,反映一定认知结果的数据对象、数据对象之间关系的描述与客观存在的一种对应关系。因此,信息模型中的语义与对客观存在的概念化以及描述认知结果的语言密切相关。定义这种语义的核心就是在数据的相互关系中定义数据的含义。  要在语义层次上实现信息的互操作性,需要对信息的意思有一个一致的共同的理解。语义Web采用了本体论(Ontology)的思想。本体被视为是建立智能系统(或狭义地,知识表示系统)的世界观,是对应用领域概念化的显式的解释说明。本体为某领域提供了的一个共享的通用的理解,从而无论使人还是应用系统之间都能够有效地进行语义上的理解和通信。语义Web语言可以看作是在Web上对信息资源的本体进行定义和描述的语言,并能够用其所定义的本体对具体信息资源进行描述。  RDF技术是针对Web资源的日益丰富带来的搜索问题而发展起来的关于元数据(Metadata)的一个数据结构。元数据是网络资源相关的信息,通过元数据,可以很好的进行Web资源的搜索,提高搜索的准确性,以及为Agent等新的软件技术提供智能化的基础。  RDF结构可以很好的描述关于物件的所有信息,通过物件,属性和值这个三元组可以对网络上的资源进行描述。RDF本身是以XML技术为基础的一个数据结构,XML是一种语言,因此,它是RDF模型表达的自然媒介。同时,RDF是在XML的上一层,是对语义的表达。RDF通过XML的命名空间机制关联相应的RDFS规范,使RDF模型的语义一目了然。  RDF模式是一个抽象范畴的资源描述框架。该模式的许多思想为知识的表示提供了一种新的思路。知识也可看作一种资源,如果用RDF模式描述知识,则为基于Web的智能系统提供了一个统一的数据源,为语义化网络的架构的实现提供基础。  另一方面,RDF模型是综合从语义网络和框架这两种知识表示方法而产生的,虽然RDF技术的发展方向是对元数据进行描述,但把它作为一种知识表示机制是可行的。  用RDF结构描述知识具有知识结构体系结构层次清晰,容易维护和修改的特点,但最能发挥这种知识表示长处的应用领域是基于网络的一些智能应用。  目前本体建模活动方兴未艾,但大多数把注意力放在静态本体方面,即注重对存在的事物、它们的属性以及它们之间的关系进行建模,静态本体已经小成气候,此类本体经常见诸于W3C的各个相关文档。而对于动态本体的建模还比较少,其中以对象管理组织(OMG)的本体元建模理论与自组织MDA方法中涉及的过程本体建模影响最大,MDA中的动态本体建模主要是在MOF框架内进行,是为OMG的MOF框架服务的。而本文把本体建模引入软件工程领域,试图在传统的软件工程研究和新兴语义网之间架设桥梁。本文选取IEEE“软件验证与确认”标准为对象,探讨对软件工程中的“软件验证与确认”活动的RDF本体建模。  本文内容安排如下:  第二章介绍背景知识,首先介绍语义Web的起源及内容,然后详细介绍语义Web的两个核心概念——本体论和RDF,同时介绍这些概念之间的联系。  第三章探讨如何用RDF格式表达一阶谓词逻辑公理,提供基于RDF建模的逻辑理论基础。  第四章具体介绍本文对IEEE“软件验证与确认”活动本体建模的实现,其中会涉及本体开发方法的探讨和本体开发工具Protégé的介绍。  第五章总结和展望将来的发展方向。
其他文献
随着IPv6的兴起,研究如何从IPv4渐进地,无缝地过渡到IPv6成了一个热门话题.目前,对于从IPv4向IPv6过渡技术主要有双协议栈、隧道技术和NAT-PT技术.当IPv4节点在NAT后,如何接
随着Web服务的迅速发展,Web服务的服务质量(QoS)成了判定Web服务是否成功的重要因素.然而,由于Web服务还是个新生事物,许多方面的技术还不成熟.该文提出了利用简单对象访问协
数据仓库和数据挖掘是数据库研究、开发和应用最活跃的分支之一。所谓数据仓库,就是把一个单位的历史数据收集到一个中央仓库中以便于处理,它是支持决策过程的,面向主题的、集成
随着虚拟现实技术的发展,虚拟现实平台已不仅仅作为一个仿真模拟的交互平台,虚拟现实平台也可以作为搜集、组织和呈现现实社会信息的工具。如何在虚拟现实平台的基础上采集、组
软件不仅仅是程序,软件的构造应该遵循工程的方法.着眼于软件系统整体结构的软件体系结构成为软件工程研究的中心问题.软件体系结构的基本组成元素及其配置,基本元素的行为及
在音乐信息检索领域中,基于内容的音乐识别和基于内容的音乐推荐是极具市场价值的两个应用。在本文中,这两个问题将在一个统一的、基于音频音乐字模型的音乐表示框架下被讨论。
当前时态地理信息系统TGIS(Temporal GIS)的研究已经成为GIS理论界和数据库团体关注的前沿研究热点之一,而TGIS的核心是时空数据模型.目前学术界提出的时空数据模型存在许多
近些年,在辅助教学领域,平板电脑和手机等手持智能设备越来越流行。利用触摸输入,这些设备为交互式图形查询提供了新的机遇,同时也为复杂图形识别带来了新的挑战。在平面几何教学
图像增强技术在计算机视觉上有着重要的应用价值。通常,对于智能监控、户外对象识别、海洋工程等任务,都假设获得的图像是足够清晰的,具有理想的能见度和亮度的图像。然而,由于极
网络的飞速发展使得对高质量的Web文本信息检索的需求变得空前迫切。在大多数信息检索任务中,用户的需求描述模糊而简短,而已知文档信息的描述空间则非常大且内容复杂。因此信