论文部分内容阅读
随着经济的发展,企业以及图书馆等机构的文献数量迅速增加。信息资源的增长伴随的是人们信息需求水平的变化,用户对信息质量的要求越来越高。这给情报检索技术带来了巨大挑战,因此新的理论和方法被引入到信息管理领域,其中之一就是本体论以及基于本体论的知识检索技术。本体是概念化的明确的规范说明,从本质上,本体论就是某一领域中的概念以及这些概念间关系的集合,关系反映了概念间的约束和联系。本体论已经成功地用于人工智能领域(AI)的知识表示。利用本体论理论和技术,把显性或隐性知识转变得可以被机器轻易识别,并使系统具有自动学习和推理能力,将大大提高用户检索信息的查全率和查准率,在解决信息检索中存在信息冗余、检索效率低下的问题上有着很大的优势,使得知识的管理更高效优质,其应用价值不言而喻。本文将讨论本体论的知识表示、构建理论以及基于本体的知识检索。笔者在调研了国内外大量文献和网络资源(包括使用软件工具)的基础上,论述知识检索概念,与信息检索、语义检索的同异;阐述本体的起源、概念、类型,流行的本体知识库,以及基于本体的知识检索过程;详细介绍了本体论的知识表示理论,包括基于知识表示元语和方法,即利用本体元语进行知识的形式化描述。为了更好地阐述本体知识表示的原理和方法,本论文选取了一个学科领域——机械加工工艺学作为入口,以该学科作为本体构建的领域知识,通过提取其核心概念集并建立概念关系,举例说明领域概念的获取以及建立概念间关系的方法,这是建立一个本体的关键步骤之一。同时,还详细说明了本体的构建理论和方法,包括一般性原则,主要的构建方法、本体语言和重要的本体编辑工具。论文详细探讨了基于本体论的知识检索的基本原理、模型、检索策略及方法。对一个通用的基于本体论的知识检索模型进行探讨时,笔者就其中一些理论阐述了自己的不同认识,并作了一定的改造,进而完善模型。在这个基础上,论文介绍了一个国内的知识检索系统原型——Kretrieval。目前,国外已经有了例如OntoFeb、OntoKnowledge这样较为成功的基于本体论的知识检索系统。相比之下,国内在本体论方面的研究刚刚起步,对本体论用于知识检索的相关方法和模型研究都十分缺乏,但经过国内科研研究人员的努力已经取得了一些进步,Kretrieval就是其中一项成果,这是国内的研究人员开发设计的一个基于本体的知识检索实验系统原型。Kretrieval系统是国家自然科学基金资助、同时也是教育部人文社会科学研究重大项目“信息可视化与知识检索(IVAKR)”的实验系统之一。笔者将就KR模型的知识获取、组织原理和实现方法,以及KR系统模型及其检索原理和过程进行详细说明,并对该系统进行评价。基于本体论的知识检索系统具有很高的应用价值,将这种技术引入现代图书情报工作,将是未来的趋势。