论文部分内容阅读
随着新兴技术的不断发展,人类已经进入知识社会。如何表示和管理这些不同的知识,并将它们集成到一起是一个亟待解决的问题。本体就是在这样的背景下产生的。创建本体的目的就是要实现跨领域的知识共享、复用和推理。然而,本体之间的异构问题广泛存在于多种应用当中。本体映射是解决这一问题的最佳途径,它使用户以一种透明的方式,在多个本体中实现对知识的访问。它成为构建一个集成的知识网络的必不可少的关键环节,是本体工程、信息融合、Web服务组合和对等模式应用中的重要研究课题,也是一个非常活跃的研究领域。本文着眼于本体映射问题,针对这一问题的不同方面,展开了相关研究工作,并提出了四种不同类型的本体映射算法,以解决多种实际问题。针对大规模本体映射的需求,提出一种基于概念集群的本体压缩算法。方法利用概念在本体中的特殊作用,使用DICE系数法和属性信息熵的综合得到概念间的语义关系,并据此进行概念的集群和压缩过程,将与映射发现无关的概念进行合理约减,压缩参与映射的本体体积,从而提高映射性能;针对本体间n:m映射问题,提出了一种基于聚类的本体块匹配方法。利用Hownet获得匹配元间的语义相似度,根据层次聚类方法的思想,对本体进行分块,不断的进行类簇之间的凝聚过程。当分块结束以后,就可发现每个类簇内实体之间的m:n映射。这一方法使分块和映射同时完成,降低了块映射问题的复杂程度;此外,由于使用Hownet词库中的资源计算语义相似度,因此方法还可以解决汉语本体的映射问题。提出一种混合的本体映射方法,尝试了一种新的映射途径。通过语义距离和字符距离揭示本体元素级的映射关系,并构建语义关系图,将元素级和结构级的映射发现组合起来,完成问题的求解。避免了单一方法不能利用本体全部信息的不足,为映射问题的解决提供框架,使映射结果更为理想。针对本体实体相似度合并中需要大量的人工参与的问题,探索了一个新的相似度合并的思路,提出一种基于支持向量机的本体映射方法。方法使用多种策略获得了实体间的相似度,在相似度结果合并中,提出了相似立方体的概念,通过其上的切块,将映射发现问题转化为分类问题。并使用支持向量机完成了这一任务。从而实现了减少人工干预,提高映射的精度的目的。