论文部分内容阅读
现代电子计算机与通信技术的应用和发展,极大地促进了世界范围内人类知识的传播和文化的交流。特别是Internet的产生和发展,使全人类的交流更加方便和快捷。WWW(World Wide Web)作为全球性的网络信息系统,极大促进了Internet之上的全球信息传播。 然而,在伴随着Web成功的同时,呈指数级增长的海量信息使得来自各领域的用户对信息的查找、访问、表示以及维护变得越来越困难起来。“丰富的数据和贫乏的知识”问题越来越突出,主要的原因是目前的Web对信息的表示主要是“呈现”式的,大量的信息以自然语言、图片等方式罗列出来,使人淹没于知识的辨别、提取等繁杂的劳动中。对于目前Web上的信息,计算机只能从格式上来处理和验证,并不能处理知识级别的问题。 从目前情况看,Internet要想完全发挥其威力,不仅在于更快的处理器和更多的带宽,还在于建立一种更有利于交流与对话的机制,排除一切平台和语言的分歧,以自由、平等、开放的原则,以人类对现实世界的一致理解为基础,为全人类提供一种全新的高质量的信息服务。 在Internet互联网发展过程中,取得成功的最重要因素之一就是建立了一套广泛的标准,保证了在不同层次上的互操作能力。有三大技术起了决定性的作用:第一是分组交换技术和中介信息处理器(Interface MessageProcessor)的发明,使Internet的前身ARPANet(AdvancedResearch ProjectsAgency Network)网得以诞生,互联在技术上成为可能。第二是TCP/IP协议的提出与实施,使ARPANet扩展延伸,数据传输畅通无阻。第三是HTML,XML等数据表示标准的出现,使得Web成为一个全球最大的信息资源利用系统。可以看出,分组交换技术和中介信息处理器的发明使得信息交换在物理层的扩展成为了可能;TCP/IP,HTIP,FTP等协议保证了不同信息资源在网络上的通信;而在此之上的HTML,XML等Web语言在语法上统一了网上信息的表示形式和数据结构。 但是,仅依靠一种统一Web语言从语法上来实现信息的交换和共享还是不够的。例如,两个应用系统都采用XML作为信息交换的格式,但怎么能保证它们表述的是同一个意思?标记语言中一个元素和其子元素的关系,是超类与子类的关系还是组成关系?计算机能够区分吗?与“机器可读”相比,“机器可理解”是必要的和重要的。这就需要一种机制,使得计算机不但是能读取数据,还要能理解和区分数据的语义,实现Web信息语义层次上的互操作性。 语义Web就是在此背景下提出来的。语义Web的思想就是利用元数据(metadata语言对Web信息资源的内容进行语义上的描述,从而使计算机能够利用这些语义信息对信息资源的内容进行理解和处理,并在此基础上,实现更高层的、基于知识的智能应用。可以看出,这里所指的“语义”不同于语义学中的定义。从语义学的角度来讲,语义是语言形式表达的内容,语义是思维的体现者,是客观事物在人们头脑中的反映,是人们交际过程中的中心所在。从计算机科学的信息模型的角度来讲,语义是构建在一定的语法上,反映一定认知结果的数据对象、数据对象之间关系的描述与客观存在的一种对应关系。因此,信息模型中的语义与对客观存在的概念化以及描述认知结果的语言密切相关。定义这种语义的核心就是在数据的相互关系中定义数据的含义。 要在语义层次上实现信息的互操作性,需要对信息的意思有一个一致的共同的理解。语义Web采用了本体论(Ontology)的思想。本体被视为是建立智能系统(或狭义地,知识表示系统)的世界观,是对应用领域概念化的显式的解释说明。本体为某领域提供了的一个共享的通用的理解,从而无论使人还是应用系统之间都能够有效地进行语义上的理解和通信。语义Web语言可以看作是在Web上对信息资源的本体进行定义和描述的语言,并能够用其所定义的本体对具体信息资源进行描述。 RDF技术是针对Web资源的日益丰富带来的搜索问题而发展起来的关于元数据(Metadata)的一个数据结构。元数据是网络资源相关的信息,通过元数据,可以很好的进行Web资源的搜索,提高搜索的准确性,以及为Agent等新的软件技术提供智能化的基础。 RDF结构可以很好的描述关于物件的所有信息,通过物件,属性和值这个三元组可以对网络上的资源进行描述。RDF本身是以XML技术为基础的一个数据结构,XML是一种语言,因此,它是RDF模型表达的自然媒介。同时,RDF是在XML的上一层,是对语义的表达。RDF通过XML的命名空间机制关联相应的RDFS规范,使RDF模型的语义一目了然。 RDF模式是一个抽象范畴的资源描述框架。该模式的许多思想为知识的表示提供了一种新的思路。知识也可看作一种资源,如果用RDF模式描述知识,则为基于Web的智能系统提供了一个统一的数据源,为语义化网络的架构的实现提供基础。 另一方面,RDF模型是综合从语义网络和框架这两种知识表示方法而产生的,虽然RDF技术的发展方向是对元数据进行描述,但把它作为一种知识表示机制是可行的。 用RDF结构描述知识具有知识结构体系结构层次清晰,容易维护和修改的特点,但最能发挥这种知识表示长处的应用领域是基于网络的一些智能应用。 目前本体建模活动方兴未艾,但大多数把注意力放在静态本体方面,即注重对存在的事物、它们的属性以及它们之间的关系进行建模,静态本体已经小成气候,此类本体经常见诸于W3C的各个相关文档。而对于动态本体的建模还比较少,其中以对象管理组织(OMG)的本体元建模理论与自组织MDA方法中涉及的过程本体建模影响最大,MDA中的动态本体建模主要是在MOF框架内进行,是为OMG的MOF框架服务的。而本文把本体建模引入软件工程领域,试图在传统的软件工程研究和新兴语义网之间架设桥梁。本文选取IEEE“软件验证与确认”标准为对象,探讨对软件工程中的“软件验证与确认”活动的RDF本体建模。 本文内容安排如下: 第二章介绍背景知识,首先介绍语义Web的起源及内容,然后详细介绍语义Web的两个核心概念——本体论和RDF,同时介绍这些概念之间的联系。 第三章探讨如何用RDF格式表达一阶谓词逻辑公理,提供基于RDF建模的逻辑理论基础。 第四章具体介绍本文对IEEE“软件验证与确认”活动本体建模的实现,其中会涉及本体开发方法的探讨和本体开发工具Protégé的介绍。 第五章总结和展望将来的发展方向。