常识知识问答系统中知识库构建的研究与设计

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:zdjige
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识库作为问答系统中用来储存知识的仓库,在整个系统中起到了非常重要的作用。一个功能和知识完备的知识库能够大大提高问答系统的效率与准确率。因此本文主要讨论问答系统的知识库构建的思想方法。 本文知识库的设计主要针对常识知识问答系统,由于常识知识的领域范围较广,知识的稳定性较差,因此知识的搜集和分类整理以及长期的维护将是知识库的一项重要任务。为了克服传统的基于知识库的问答系统需要建立大规模知识库,消耗大量的人力物力,以及基于传统信息检索与信息提取的问答系统答案准确性不高的缺点;同时充分发挥前者问答准确,可以进行一定的推理计算的优点,本文将上述两种方法结合起来,扬长避短,构建高效的知识库。本文主要从以下几个方面进行了研究: 1.基于问题的面向对象知识表示方法是本文构建知识库的主要方法,它是 以面向对象表示法为主体,每个对象以一个单独的文本来描述。将用户针对该对象经常提出的问题的类型名作为类或对象的属性名,能够回答该问题的文本内容作为属性的值。本文将用户问题分为十类,每一类对应一个属性名称,该属性名称作为标记将标注到描述对象的文本中。 利用基于问题的面向对象的知识表示方法,可以避免人工将知识形式化为知识点的繁杂过程。 2.研究利用“简单向量距离法”对入库的文本进行自动分类。 3.研究利用特征词典通过对句子进行特征提取的方法对原始文本进行自动标记。 本文对于知识的搜集分类以及文本的标注均采用机器自动为主,人工干预为辅的策略,在减少人力的同时大大提高了准确率。 4.利用本文构建的知识库高效准确地获取答案的方法。
其他文献
在随机系统中如何快速监测变点问题有很多重要的应用,包括工业质量控制,控制自动系统的自动故障监测,等等。为了处理这些问题,各种控制图被提出来了,比如说,Shewhart 图,CUSUM, EWM
随着计算机技术的飞速发展,人们已经可以让计算机完成一些过去无法想象的任务。生命科学与工程科学的相互交叉和相互促进是现代科学技术发展的一个显著特点,也是近年来相关学
从20世纪60年代起,广义度量空间理论一直是一般拓扑学中活跃的研究方向。由于各种网比起“形式太好”的基具有更加微妙和更加可变的结构,拓扑学者们通过对各种网进行各种各样常
奇异边值问题一直是数学工作者和其他科学工作者关心的重要问题之一,它起源于核物理,气体动力学,流体力学,边界层理论以及非线性光学等,本文主要利用非线性泛函分析的拓扑度方法研
C*-代数自由积是由D.Avitzour与D.V.Voiculescu在上世纪八十年代几乎同时独立定义的,目前已成为算子代数理论中的重要研究对象之一.本文主要研究C*-代数自由积上的映射问题,全