论文部分内容阅读
近年来,随着互联网领域的空前发展,海量的信息充斥在互联网中,传统的搜索引擎已不能满足用户从这些信息中快速、准确的获取所需的知识。在此情形下,自动问答系统因其能够准确、直接地回答某些领域的专业问题而逐渐成为研究的热点。但是,用户在使用自动问答系统的过程中,所提的问句往往有多样性和随意性等特点,这就使系统准确获取用户问句的语义很困难,所以目前自动问答系统所反馈的答案的准确率还不高。另一方面,在全球一体化的背景下,人们不再满足于使用母语检索信息,更希望实现跨语种的信息查询,然而跨语种问句的自动翻译目前是自然语言处理领域中的一个难题。在跨语种信息查询的自动问答系统中,中英双语问答系统有着独特的应用价值,因为中文是世界上使用人数最多的语言,而英文则是使用最广泛的语言。自动问答系统的第一个执行阶段是问句理解阶段,它的目的是让计算机理解用户的问句语义,获取用户的提问意图,为后面的信息检索提供依据。问句理解一般包含词法分析、句法分析和语义分析三个阶段,目前,问句的语义分析仍然是自然语言处理的瓶颈。在面向领域的信息检索与问答系统中,用户的查询具有相似性,例如在基于本体的知识库中,很多都是对概念或实体的属性进行查询,还有些是对概念之间的关系以及属性之间的关系进行查询,这些查询语句在结构上是相似的,所以我们可以把这些查询语句抽取成基于领域本体的、具有代表性、封装有语义信息的问句模板,从而有效地避免复杂的语义分析,提高问答系统的准确率。因此,研究基于领域本体和模板逻辑的问句理解方法具有十分重要的现实意义。基于这些现实意义,本文从领域本体和模板逻辑两个方面来研究基于课程领域本体的中英双语问答系统,并提出了一种基于领域本体和模板逻辑的问句模板结构,该结构可以跨语言、精确地表达出问句模板的语义。论文主要做了以下四个方面的工作:(1)构建了适用于中英双语问答的课程领域本体。本文利用本体技术来构建知识库,实现了基于《计算机基础教程》课程领域的中英文双语本体,并通过构建的领域本体实现了领域知识的形式化与共享。(2)提出了基于领域本体和模板逻辑的问句模板结构。通过基于领域本体和模板逻辑的问句模板结构提高了问句模板的语义精度,实现了基于逻辑表达式的跨语种的问句语义表示,同时通过基于领域本体的一阶模板逻辑系统增强了问句模板的表达能力和代表性,从而减少了问句模板库的规模。(3)提出了基于领域本体和模板逻辑的问句处理和匹配方法。通过基于领域本体和模板逻辑的问句处理和匹配方法消除了语义分析带来的部分歧义,同时由于该方法不需要句法分析,使得问句的匹配过程简便,问答系统的准确率得到了提高。(4)中英双语问答系统的实现。运用软件工程和本体的一般理论,采用J2EE技术架构对基于《计算机基础教程》课程领域的中英双语问答系统进行了设计和实现,并对这个应用系统的性能进行了实验和评价。