论文部分内容阅读
当前语义Web在Web技术领域已成为一个研究热点,语义Web不是一种全新的Web,而是对当前Web的扩展,其中的信息被赋予明确的含义,使机器和人能更好的协同工作。Web上的信息是用结构化形式表示的,其中的语义是通过本体来描述。本体是共享概念模型的明确的形式化的规范说明。由于创建者和建模方法不同,要实现信息的共享就要对信息达成一致的理解,也就是在相关本体之间建立映射。 本文在介绍Web技术发展的基础上,阐述了语义Web相关技术基础,包括本体的概念、分类、本体描述语言及形式化基础,对现有本体映射方法进行分类,并重点介绍了几个已有的本体映射工程的相似度计算方法或映射过程。在此基础上采用一种混合的相似度度量方法,初步实现了用OWL DL作为描述语言的本体之间的映射。为了提高映射效率,使用多种策略构建候选映射空间而不是直接生成所有可能的候选映射对,首先从具有相近标签的实体开始构造,然后对其中相似度较高的实体进行繁殖,即把与它们相关的实体组成映射对添加到候选映射空间。在相似度方面,分别从实体层、语义网络层和描述逻辑层上计算实体在本体模型中的相似度,除了使用编辑距离外还引入了应用本体WordNet计算实体之间的初始相似度,之后使用启发式规则对相似度进行细化,每条规则都是基于实体在本体模型中的某种特征抽取出来的。然后在本体专家的参与下,对由不同规则计算出来的相似度赋予不同的权值,生成综合相似度,相似度足够大的映射对则认为映射成立。重用已经被认为成立的映射对可以对相似度的计算产生积极的影响,并且可以减少候选映射空间中的候选映射对的数目,所以可以提高映射速度。 文章通过输入两个有关教育系统的特殊本体对映射过程做了详细说明,指出了影响映射过程的关键问题,并给出了在保证映射质量的前提下提高映射效率的建议。由于基于语义Web的本体映射研究还处于起步阶段,还有很多工作要做,所以文章最后对进一步工作进行了探讨。