论文部分内容阅读
本体是一种有效地表现概念的层次结构和概念语义的模型,它被广泛的应用到了计算机科学的许多领域。在对语义网技术的研究过程中,本体更是我们研究的重点。但是伴随着语义网的快速发展,本体的异构的现象也越来越严重了,解决本体异构的问题已是关系到语义网发展的关键。虽然现在出现了许多本体匹配的方法或系统。但是这些方法或系统仍然存在着很大的不足,如对多策略相似度计算后的值进行汇聚时缺乏科学性、通用性、对初始匹配对的匹配提取不完整、错误率较高等。本文针对目前的一些本体匹配技术出现的问题,综合考虑本体在名称、结构、实例、属性方面的特征,提出了基于动态权值的本体综合匹配方法。该方法能够根据每种相似度计算策略的计算结果,采用动态权值的计算方法(Dynamicweighting method,DWM)计算该相似度策略的汇聚权值。由于每种相似度计算策略对于不同的本体计算出的结果不尽相同,因此汇聚权值也是动态变化的,所以叫做动态权值计算方法。对于汇聚后得到的初始匹配矩阵,本文在naive descendingextraction(NAIVE)算法的基础上进行改进,提出了一种NAIVE2匹配提取算法,克服了NAIVE算法对相似度值相差不大的匹配对的错误判断。对于在本体结构相似度计算策略的选择上,本文提出了基于关联规则挖掘的相似度计算方法,有效的计算了概念在结构方面的相似性。本文利用OAEI2011的benchmark本体测试集对本文的方法进行了实验验证,显示出了较好的效果。同时,本文所用的综合匹配方法在一个实际的项目中也得到了应用。