基于本体的数据集成研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:superdai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何解决语义异构问题是当前数据集成领域的研究热点。由于本体既准确地描述了概念含义又描述了概念之间的内在关联,能通过逻辑推理获取概念之间蕴涵的关系,具有很强的表达概念语义和获取知识的能力,因此本体被用来解决语义异构的问题。本文采用本体的方法对数据集成领域几个关键技术进行了研究。本文深入讨论了本体模型的构建,选择描述逻辑对本体进行描述,并讨论了对描述逻辑的扩展。介绍了资源的基于描述逻辑的本体化描述。本文讨论了文档处理的两个过程。对于文档的概念提取,本文采用基于FCA概念构造算法CLCA建立了文档信息概念间的层次关系。对于文档的语义标注,本文首先采用矢量空间模型的方法提取文档的特征向量,然后采用基于模糊C均值的聚类方法使文档找到所归属的类别,对于样本文档到各类聚类中心距离的计算本文提出了一种基于方差的容差距离改进算法。本体查询模型中查询过程为查询的关键词与本体概念之间及本体概念与本体概念之间相似度的匹配过程。本文提出一种基于概念定义、概念结构信息、概念实例综合相似度计算的本体查询方法,采用免疫算法的优化方法使权重的取值自适应调整达到最优。本文介绍了基于向量空间模型的经典相关反馈算法和基于方差分析的权值调整相关反馈算法,并提出一种基于两种相关反馈算法相结合的方法,将新的检索词加入到查询中扩展查询检索式,并对列向量采用方差计算,对能使相关文档和不相关文档区分开的特征重新赋予较高的权重,不仅提高了查准率和查全率,而且提高了查询的效率,实验证明它优越于前两种算法。本文最后给出了一个基于本体数据集成的简单的实验系统。建立一个简单的病毒本体,并设计Web化的查询系统,使用户在查询病毒时能很精确地找到资料,并且可以查看属性特征的概念相似度,找出不同病毒的属性间的关联关系,还可在系统中直接获取更多详细的病毒信息和杀毒方法。
其他文献
IPv4存在地址空间严重不足、对移动性的支持不好等缺陷。而IPv6成为下一代互联网的核心协议已是一个不争的事实。作为IPv6协议重要组成部分的移动IPv6协议,它能够为用户提供大
烟支计数是中小型卷烟厂生产车间必须完成的一道工序。利用图像处理技术对烟支进行计数,是一种可选的方案。先二值化,则信息损失严重;直接基于彩色图像对烟支进行识别计数,虽
随着计算机运算速度的提高和计算机网络的发展,基于离散对数问题和大整数因子分解问题的数字签名算法越来越不能满足信息安全的需要。为了满足信息安全的要求,安全性依赖于椭圆
等值的研究对于考试的公平性、题库建设、教学质量评价和计算机化自适应测验都具有重要的意义。随着考试研究的深入,题组题型越来越多地出现在各类考试当中,例如阅读理解、数学
计算机立体视觉的主要研究内容是由多幅二维的平面图像恢复出被摄物体的深度信息,而其中基于两幅图像的双目视觉技术则是一个研究热点。双目立体视觉的基本原理是模仿人眼与
嵌入式数据库管理系统是近几年才发展起来的,它以传统的数据库管理技术为基础,并结合嵌入式环境的具体特点,实现对嵌入式设备上数据方便、统一的管理。在本文中,设计并实现了一个
Web Services作为下一代电子商务的核心技术,已经得到了广泛的应用,但随之而来的安全问题也日益突出。SOAP作为Web Services技术的核心协议,承载着Web Services安全的绝大部分责
近年来,IT技术的迅猛发展使得国内银行业掀起了“大集中”的浪潮,各家银行纷纷展开了大集中系统的建设。银行IT系统的数据集中建设,在业务上,能够为银行建立全行业务的统一视图;在
本论文以国家自然科学基金项目:基于Agent和数据挖掘的假日旅游状态和安全事故预测预警研究(60442003)、北京市教育委员会科技发展计划重点项目:基于数据挖掘和Agent的假日旅
随着互联网技术和传感器技术的飞速发展,人们探索海洋的手段越来越多样化,所产生的数据种类也越来越丰富,全球立体海洋观测网Argo的建立为海洋和气象变化领域的研究提供了宝贵的