论文部分内容阅读
随着计算机网络应用的普及,人们利用信息技术搜集数据的能力大幅提高。面对互联网上各个领域积累的数以百万计的海量数据,如何从中获得有用的知识,即理解领域知识并合理运用领域知识已经成为研究焦点。问答系统正是在这种情况下产生发展的,问答系统是信息检索的一种形式,相对于传统信息检索形式——Google、Baidu的水平式搜索,面向领域建立的问答系统能更好的改善领域问题检索的相关性,进而提高系统检索质量。本文从分析研究领域知识的理解方法、领域问题的应答方法来开展农业问答系统的研究工作,研究内容具体分为三个方面:一、领域知识方面,研究了基于《农业科学叙词表》转化而来的农业领域本体;同时,在分析农业问答知识特点的基础上,借助OWL本体语言表示方式构建了一个初级农业问答本体。二、问题理解方面,利用词法分析、句法分析等自然语言处理技术,再结合农业领域本体知识来获得用户问句的主要信息:问句类型、问句疑问词、问句关键词,并进一步对问句关键词进行主题概念扩展以获得全面的用户问句语义信息,为问句应答作准备。三、问句应答方面,采用基于向量空间模型(VSM)的方法进行问句相似度计算。本文在确定候选问句集的基础上,再进行基于用户问句主题概念特征与候选问句关键词特征的向量空间模型相似度计算,最后获得相似度逆序排列的候选问句列表。问句候选集由农业问答本体中与用户问句类型相同的问句组成,候选问句集缩小了问句检索范围,能提高系统检索效率。最后本文基于以上的研究内容,建立了一个基于农业领域本体和农业问答本体的问题应答原型系统,系统包括问句理解、问句答案检索、问答本体转化三个模块,该系统的性能评定通过问句的查全率和查准率来衡量,实验结果表明,基于农业问答本体和农业领域本体技术,问题应答系统的问句查全率、查准率有一定提高。