论文部分内容阅读
本体论(ontology)是一个哲学上的概念,是指哲学中研究世界的本原或本性的部分。不少哲学家把本体论看作是西方传统哲学思想(从柏拉图到黑格尔)的主干或”第一哲学”。从本体论的基本概念出发,哲学上把本体论定义为”对世界上客观事物所进行的系统描述”。
近20年来,本体论已被广泛应用于信息科学和计算机领域,并已作为当今信息科学研究前沿的一个热点,备受世界众多国家的重视。前些年,国内外相继召开了一系列相关的专题研讨会。2001年11月,德国洪堡基金会将高达200万美元的保罗奖(Wolfsang PaulAward)授予了美国布法罗大学的哲学家史密斯(BarrySmith),用于资助其将形式本体论(formalontol-ogy)的哲学方法和理论应用于信息科学领域。
将本体论引入信息科学,就是从本体论层次上考察事物的运动状态及其状态的改变方式,使本体论意义上的信息赋予更具体的内涵。因此,在信息科学中,本体论是对概念化对象的一种表示和描述,在计算机领域是指定义元数据及其相关关系的“规范”。本体论依赖于所采用的语言,按照表示和描述的形式化程度不同,可以分为完全非形式化的、半形式化的和严格形式化。本体论形式化程度越高,越有利于计算机进行自动处理。
一般而言,一个本体由以下几个方面构成.该领域对象类的层次体系、对象类的属性及属性的取值范围、对象之间除层次关系之外其他的语义关系、一定的推理规则即公理。
在20世纪90年代,本体论研究在计算机技术领域的应用曰趋流行,在知识工程、数据库设计和集成、信息检索和提取、知识管理、软件需求分析、面向对象技术和基于Agent的系统设计中扮演着越来越重要的角色。其中,最为突出的应用是智能信息检索。
理想的智能信息检索系统应该是 提供友好的用户检索交互界面;基于自然语言或实例的查询,依据用户浏览和检索的习惯信息,熟悉用户的兴趣爱好,建立一定的用户描述,主动向用户提供相关的信息;针对用户查询请求自动向用户提供相关文档页面,不需用户重复发现知识;综合利用个性化检索和集中浏览的优势;检索速度快,能够快速地返回查询结果,高检索率(多)和高检索精度(准)。
基于Ontology的智能检索信息系统由于能提供查询和资源描述所必需的元语,并通过领域语义模型为信息源提供语义标注信息,从而使系统内的所有Agent对领域内的概念、概念之间的联系及领域内的基本公理知识有一个统一的认识,进一步提高了系统的联想能力和精确性,为用户提供有价值的信息和一个全面的共同视图。
本体论在信息检索领域的另一个应用就是语义网的开发。在语义网中,所有信息都将是有明确语义的信息,从而自动对网络上的资源进行处理,使网络信息得到更充分的利用。本体具有良好的概念层次结构和支持知识的推理,本体论则成为构建语义网的核心内容。
语义网的层次结构包括XML十XML Schema层,是数据表示的语法层,RDF+RDF Schema层,是元数据层;OntologyVocabu-lary层,是本体层,Logic逻辑层,是在领域知识基础上为进一步逻辑推理提供形式规则,Proof层,为智能代理间进行验证交换数据签名提供支持。RDFS层和本体层是语义网中对数据赋予语义信息的层次。XML Schema主要用于确定XML文档的结构。RDF的作用是将XML数据的语义信息无歧义地映射到一个模型中,即确定各部分的语义信息,RDF的数据模型提供了抽象的概念框架描述元数据。RDFS则是在RDF的基础上提供了更多建模原语用于元数据定义,这些原语对进一步构造本体有一定作用,但是其功能仍然有限。为了构造更加完备的本体信息以支持自动推理,需要更加完备的本体描述语言。Web本体语言(WebOntologyLanguage,即OWL)就是针对这种需求来设计的,是一种用来描述领域结构的语言。它主要采用面向对象的方式来描述领域知识,在RDF和RDFS基础上通过增加更多建模原语来描述特征和类以及它们之间的关系,并针对特征提供更加丰富的类型定义和属性描述。典型的本体论都有一个分类法和一组相应的推理规则。分类揭示了对象的类及它们之间的关系,推理规则为语义网提供了一定的推理能力。
在语义网中应用本体控制RDF层信息能够根据ontology结构自动处理信息。
尽管本体论在哲学上有很长历史,但将其引入信息科学的时间并不长,主要在信息检索占有突出位置。目前,ontology智能信息检索系统还处于实验研究阶段,ontology的构建方法、基于ontology的系统结构、ontology与XML和RDF等相关技术结合问题是ontology在信息检索领域走向实用的关键。
近20年来,本体论已被广泛应用于信息科学和计算机领域,并已作为当今信息科学研究前沿的一个热点,备受世界众多国家的重视。前些年,国内外相继召开了一系列相关的专题研讨会。2001年11月,德国洪堡基金会将高达200万美元的保罗奖(Wolfsang PaulAward)授予了美国布法罗大学的哲学家史密斯(BarrySmith),用于资助其将形式本体论(formalontol-ogy)的哲学方法和理论应用于信息科学领域。
将本体论引入信息科学,就是从本体论层次上考察事物的运动状态及其状态的改变方式,使本体论意义上的信息赋予更具体的内涵。因此,在信息科学中,本体论是对概念化对象的一种表示和描述,在计算机领域是指定义元数据及其相关关系的“规范”。本体论依赖于所采用的语言,按照表示和描述的形式化程度不同,可以分为完全非形式化的、半形式化的和严格形式化。本体论形式化程度越高,越有利于计算机进行自动处理。
一般而言,一个本体由以下几个方面构成.该领域对象类的层次体系、对象类的属性及属性的取值范围、对象之间除层次关系之外其他的语义关系、一定的推理规则即公理。
在20世纪90年代,本体论研究在计算机技术领域的应用曰趋流行,在知识工程、数据库设计和集成、信息检索和提取、知识管理、软件需求分析、面向对象技术和基于Agent的系统设计中扮演着越来越重要的角色。其中,最为突出的应用是智能信息检索。
理想的智能信息检索系统应该是 提供友好的用户检索交互界面;基于自然语言或实例的查询,依据用户浏览和检索的习惯信息,熟悉用户的兴趣爱好,建立一定的用户描述,主动向用户提供相关的信息;针对用户查询请求自动向用户提供相关文档页面,不需用户重复发现知识;综合利用个性化检索和集中浏览的优势;检索速度快,能够快速地返回查询结果,高检索率(多)和高检索精度(准)。
基于Ontology的智能检索信息系统由于能提供查询和资源描述所必需的元语,并通过领域语义模型为信息源提供语义标注信息,从而使系统内的所有Agent对领域内的概念、概念之间的联系及领域内的基本公理知识有一个统一的认识,进一步提高了系统的联想能力和精确性,为用户提供有价值的信息和一个全面的共同视图。
本体论在信息检索领域的另一个应用就是语义网的开发。在语义网中,所有信息都将是有明确语义的信息,从而自动对网络上的资源进行处理,使网络信息得到更充分的利用。本体具有良好的概念层次结构和支持知识的推理,本体论则成为构建语义网的核心内容。
语义网的层次结构包括XML十XML Schema层,是数据表示的语法层,RDF+RDF Schema层,是元数据层;OntologyVocabu-lary层,是本体层,Logic逻辑层,是在领域知识基础上为进一步逻辑推理提供形式规则,Proof层,为智能代理间进行验证交换数据签名提供支持。RDFS层和本体层是语义网中对数据赋予语义信息的层次。XML Schema主要用于确定XML文档的结构。RDF的作用是将XML数据的语义信息无歧义地映射到一个模型中,即确定各部分的语义信息,RDF的数据模型提供了抽象的概念框架描述元数据。RDFS则是在RDF的基础上提供了更多建模原语用于元数据定义,这些原语对进一步构造本体有一定作用,但是其功能仍然有限。为了构造更加完备的本体信息以支持自动推理,需要更加完备的本体描述语言。Web本体语言(WebOntologyLanguage,即OWL)就是针对这种需求来设计的,是一种用来描述领域结构的语言。它主要采用面向对象的方式来描述领域知识,在RDF和RDFS基础上通过增加更多建模原语来描述特征和类以及它们之间的关系,并针对特征提供更加丰富的类型定义和属性描述。典型的本体论都有一个分类法和一组相应的推理规则。分类揭示了对象的类及它们之间的关系,推理规则为语义网提供了一定的推理能力。
在语义网中应用本体控制RDF层信息能够根据ontology结构自动处理信息。
尽管本体论在哲学上有很长历史,但将其引入信息科学的时间并不长,主要在信息检索占有突出位置。目前,ontology智能信息检索系统还处于实验研究阶段,ontology的构建方法、基于ontology的系统结构、ontology与XML和RDF等相关技术结合问题是ontology在信息检索领域走向实用的关键。