基于多文本知识源的知识修正与获取

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:hawking415
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识获取是知识工程中关键的一环,而从文本知识源中获取专业知识是一种重要而常用的途径。但从文本中获取知识并不简单,不管是手工获取还是机器获取,领域专家所使用的概念都很难被识别和抽取出来。另外,由于自然语言的歧义性、非规范性和文本知识源的多样性,常常会产生知识不一致性问题。知识获取的途径主要有三种:第一种是将文本中的概念和关系直接自动的抽取出来的自动化知识获取方式;第二种是依靠人工操作进行知识获取的非自动化知识获取方式;第三种是人机交互合作的半自动化知识获取方式。通过对上述三种知识获取途径的分析,本文选取第三种方式进行知识的获取。知识获取与知识表示两者密不可分,知识获取的前提是采用合适的方法将知识表示出来。只有知识得到了合适的表示,才能更好的实现知识的获取和合理运用。本体作为一种形式化的、概念化的知识表示方法,可以将概念间的语义关系通过层次结构很好的体现出来,而且通过对相同领域中概念的统一,可以实现知识的互通和重复利用。同时,框架表示法作为本体的一种描述语言,可以将概念中所包含的属性和属性值形象、直观的表示出来,有利于对不同知识源中的同一事物或概念进行分析和比较,实现知识不一致性的检测与修正。因此,本文采用基于本体的框架表示对知识进行获取。针对知识获取过程中的不一致性问题,本文首先提出了框架提取算法,实现了文本知识到知识框架的自动获取。其次,利用概念格对框架集的相关性进行分析,为知识框架的检测与合并奠定了基础。然后,对知识不一致性的类型进行了分析和总结,如概念名称不一致、单位类型不一致和知识粒度不一致等,并在框架表示的基础上提出了相应的处理策略。最后,以历史事件知识为例,结合不一致性策略提出了合一算法。并基于Visual studio平台进行实验验证,获取到了高精度和细粒度的历史知识,实现了知识的不一致性检测、修正与合并。通过实验证明了该方法的可行性和有效性,为下一步的知识服务奠定重要的基础。
其他文献
RFID(Radio Frequency Identification)射频识别是一种快速、非接触、实时、低成本的物品识别方式,可以广泛应用于物体识别、跟踪,并能够与广泛的基于语义和逻辑的计算应用集
Mashup是Web2.0时代的一种典型的Web应用,它易在更方便的从多个外部资源站点中获取所需要的信息,并将这些信息有机的整合在一起,从而构建出全新的应用。它具有易用灵活,数据
在数字水印技术高速发展的情况下,数字版权保护的瓶颈体现在如何利用数字水印技术来抑制数字媒体非法扩散,以及如何保护在数字产品交易过程中参与交易的各方的合法利益上,因
国际电信联盟(International Telecommunication Union,ITU)和国际标准化组织(ISO/IEC)制定了一系列视频编码标准最新的视频编码标准H.264,以此改善视频的压缩效率和增强视频
现存的序列模式挖掘算法多是基于瞬时事件的,然而在现实世界中很多事件都是发生在一段时间内,例如语言分析,网络检测等,时间间隔事件序列频繁模式挖掘在这些领域都有很重要的
僵尸网络是攻击者出于恶意目的,传播僵尸程序控制大量主机,并通过一对多的命令与控制信道所组成的网络。传统的僵尸网络主要是基于IRC、HTTP协议的集中式结构,但近年来,越来
智能交通系统(ITS)是智能视频监控系统在现代交通领域的重要应用,代表着未来交通管理的发展趋势。基于视频的车辆检测与定位技术作为ITS的关键技术,处于ITS的底层,是整个系统
随着DT(Data Technology)时代的到来,数据的价值在各行各业中越来越得到广泛重视。如何从纷繁复杂的数据中发掘去一些有价值的信息来指导和改善我们的工作和生活具有重要的意
随着互联网的高速发展,网络信息成爆炸式增长。如何快速、准确的从这些海量数据中获得有用的信息成为了人们关注的焦点。目前通用搜索引擎在搜索人物上的表现已经远远无法满
图像分割是由图像处理到图像分析的关键步骤,在实际中有着广泛的应用。将数学形态学的思想用于图像分割是近年来图像处理研究的热点之一。目前基于数学形态学图像分割方法的研