论文部分内容阅读
随着计算机应用越来越广泛,各个行业、各个部门都使用了相应的应用软件对其内部信息进行管理。而互联网的发展,要求能够实现各地区、各部门之间的互联互通,从而达到信息的交流和共享。但由于不同的用户以不同的方式对信息进行建模,导致了不同程度的异构,包括语义层的异构,使得相互联系的部门之间不能交换信息。信息集成(Information Integration)技术就是为实现各个数据源之间信息的交流和共享而发展起来的,信息集成可以最大程度的利用已有知识成果,屏蔽数据的半结构性、异构性和分布性,为用户提供同一的模式,实现异构数据源之间的信息交换及从异构数据源中有效获取信息,最终实现信息共享。 在信息集成中必须提供通过语义模型解决语义异构问题,这个通用语义模型是一个平台无关模型,屏蔽了信息之间的语义异构。本体是共享概念模型的明确的形式化规范说明,能够有效地表达特定领域内的通用知识,可作为信息集成中的通用语义模型,因此基于本体的信息集成成为目前信息集成领域中的研究热点。 本文以本体论的相关研究作为基础,在借鉴已有的信息集成方法和信息集成系统架构的基础上,设计了一种基于本体的语义信息集成系统模型OBIS,并重点对模型中存在的两层本体映射,即异构数据源与其对应的局部本体之间的映射,各局部本体与全局本体之间的映射,进行了分析和研究。本体映射相当于建立起通信规则的集合,通过这些映射规则可以使领域中的异构信息源在语义层次上取得描述的一致,并将用户提交的基于上层全局本体的查询,通过查询转换,按照映射规则,一步步变为对底层数据源的查询。本文提出利用“多匹配策略”(Multi-matching Strategy)来寻找语义相似的实体对,在此基础上,根据XPath语言(XML Path language),给出了一个在XML数据源和其局部本体图(Ontology