基于本体映射的概念相似性算法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:xzm191213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于本体的广泛应用以及万维网自身分布性特点,导致同一领域不同用户构造标识同一知识范畴的不同本体。这种表示同一知识范畴而采用不同方式构造出的不同本体,称为异构本体。本体异构使得标识同一资源的不同本体无法重用和共享,进而成为系统相互理解、信息交换、实现互操作的主要障碍之一。目前,本体映射是解决异构现象的主要方式之一。本体映射是发现两个领域本体概念之间的相关性的过程,是本体间概念和关系达成一致性的一种规范说明。本体映射框架包括五个模块,其中概念相似度计算是其中的一个核心步骤,概念相似度算法的好坏直接影响映射结果的准确性。本文设计一种综合的概念相似性算法,分别从概念的义原描述式(DEF)、概念实例和概念属性三个方面考虑。算法目的是为了克服传统算法时间和空间复杂度高、不够全面、误差大、无法量化的问题。根据《知网》描述,概念可以由义原描述,义原与义原之间的关系体现在义原层次体系结构和义原分类树上,本文从概念的两个方面:主要义原特征描述和次要义原特征描述进行相似度计算。对没有上下位关系的次要义原特征描述式中的义原,根据义原的层次体系结构来计算相似性。对有上下位关系的主要特征义原,本文根据其在义原特征树中的语义距离来计算相似度。基于义原的相似度计算消除了特定领域中概念的歧义性,但概念所属领域不同,概念的语义也可能不一样,因而在概念相似性计算中需要有能反映出概念所属领域的因素。在本体构建中,概念的实例和属性以一种特殊的概念被定义,这种定义是基于概念所属领域。因此,本文从概念的实例和属性两方面计算概念的相似性。基于实例的相似性算法,利用统计思想从大量实例中随机抽出一部分参加相似性计算,从实例的值域、范围和单位进行相似度匹配,给出相似度计算公式,并对实例相似性计算的中间数据采用特殊的压缩矩阵方式存储。基于属性的相似度计算,分别从构建本体常用到的四种属性关系:逆反关系、传递关系、对称关系、功能关系以及属性的定义域和值域考虑概念的相似性。基于这四种关系的概念是同一本体中的两个概念,本文将两个本体概念层次树中有直接映射关系的上层结点作为公共结点来计算概念的相似度。在文章的最后,构建两个异构医疗本体。通过异构医疗本体,对算法进行了验证和分析,给出了部分实验数据并与本体映射模型MOMF数据结果进行了比较,在附录中通过截图方式给出了实验用到的部分代码和数据文件。
其他文献
远程教学是目前教学改革的重要内容,而虚拟实验室填补了远程教学中教学实践方面的空白,对提高远程教学的质量具有重要的意义。但是,当前的虚拟实验平台普遍不能支持异构资源
聚类技术作为数据挖掘领域的一个重要研究方向,可以有效地帮助人们了解数据的分布和特征,以便作进一步研究分析。虽然已有的聚类算法很多,但聚类技术依然存在很多问题和挑战
学位
视频处理技术是伴随着视频从模拟到数字化转变的过程中得到蓬勃发展的。随着人们对视频图像的清晰度、流畅度、实时度的要求越来越苛刻,使其成为了一项炙手可热的技术。1980
运动人体检测是视觉人体运动分析中的关键技术,是进行各种后续处理如运动人体识别、运动人体跟踪的前提和基础,在高级人机交互、视频会议、智能视频监控等方面具有广泛的应用
数据挖掘的对象包括像关系数据库中的结构化数据,也包括诸如文本、图像、图形的半结构化数据或非结构化数据。同结构化数据相比,非结构化数据能更好地表达对象间的联系。随着
基于内容的图像检索(Content-Based Image Retrieval,CBIR)是一种利用图像的视觉特征进行检索的新兴技术,它通过提取图像的颜色、纹理、形状等底层特征进行检索。本文在学习
文本挖掘技术是现代信息处理中正在研究的热点课题。在文本挖掘过程中,文本数据预处理和文本关联规则分析是两个最主要的步骤。本文针对文本挖掘数据预处理过程中存在的问题,
本文采用支持向量机,在面向Web文本内容上对其进行分类识别研究。Web文本内容复杂,向量表示的维数大,内容上的疏密性比较明显而且很多有比较强的关联性,传统的文本分类技术效
随着云计算的迅速发展,越来越多的数据被存放在云存储服务器中。云存储作为一种新型的数据存储服务,具有的高可扩展性、高可靠性、价格低廉和可随时随地接入访问的特点,为海