论文部分内容阅读
知识库作为问答系统中用来储存知识的仓库,在整个系统中起到了非常重要的作用。一个功能和知识完备的知识库能够大大提高问答系统的效率与准确率。因此本文主要讨论问答系统的知识库构建的思想方法。 本文知识库的设计主要针对常识知识问答系统,由于常识知识的领域范围较广,知识的稳定性较差,因此知识的搜集和分类整理以及长期的维护将是知识库的一项重要任务。为了克服传统的基于知识库的问答系统需要建立大规模知识库,消耗大量的人力物力,以及基于传统信息检索与信息提取的问答系统答案准确性不高的缺点;同时充分发挥前者问答准确,可以进行一定的推理计算的优点,本文将上述两种方法结合起来,扬长避短,构建高效的知识库。本文主要从以下几个方面进行了研究: 1.基于问题的面向对象知识表示方法是本文构建知识库的主要方法,它是 以面向对象表示法为主体,每个对象以一个单独的文本来描述。将用户针对该对象经常提出的问题的类型名作为类或对象的属性名,能够回答该问题的文本内容作为属性的值。本文将用户问题分为十类,每一类对应一个属性名称,该属性名称作为标记将标注到描述对象的文本中。 利用基于问题的面向对象的知识表示方法,可以避免人工将知识形式化为知识点的繁杂过程。 2.研究利用“简单向量距离法”对入库的文本进行自动分类。 3.研究利用特征词典通过对句子进行特征提取的方法对原始文本进行自动标记。 本文对于知识的搜集分类以及文本的标注均采用机器自动为主,人工干预为辅的策略,在减少人力的同时大大提高了准确率。 4.利用本文构建的知识库高效准确地获取答案的方法。