论文部分内容阅读
随着互联网在全球的发展,信息技术给各个行业注入了新的不同元素。大学的教学方式、内容及其模式在信息技术的推动下正在发生重大的变革。信息技术的发展,使得我们不再局限于使用人工处理信息的方式来对知识进行组织、表示和处理,智能化信息处理呼之欲出。考试,是考核学生学习情况和教师教学效果的一个重要途径之一。传统的考试方式都是在纸上进行的,教师通过自己对知识的理解,对要考试的知识点进行不同的组织和表示,从而形成了不同的考试题目。目前,试题的生成都是通过人工或半自动生成的,且由于中文句子与知识表示的复杂性,目前试题生成策略的智能程度都不高,普遍存在人工干预过多,效率低下等缺陷。为了解决上述问题,本文提出了一种基于本体领域知识库的自动出题系统,使得计算机能真正的理解这些描述性知识,并在此基础上形成出题目生成策略,从而实现试题的自动生成,在很大程度上提高了出题的效率。本文以本体技术为核心,构建一个对领域概念层次、概念关系、概念定义与概念特征进行形式化描述的领域知识库,并通过知识描述的句型模板与问句模板生成题干。此外,对于试题选项的生成,论文提出了一种基于本体的概念相似度算法,采用概念相似度优先策略生成试题的选项。自动出题系统,一般包括试题的自动产生(题库管理)和自动组卷两个部分。论文主要侧重于选择题的自动产生,从以下几个方面展开研究:(1)基于本体的领域知识库的构建。领域知识库是试题生成的知识来源,它包括了特定领域中概念的定义、特征、概念与概念之间的关联关系等。首先,利用描述逻辑定义领域知识库的概念集、概念层次与概念关系集;然后,以概念关系为基础,在公理集中对抽象概念与概念特征进行定义;最后,统一用本体描述语言对领域知识库进行描述,从而构建一个由领域本体组成的领域知识库。(2)基于本体领域知识库的选择题的生成策略。选择题的生成包括题干与选项的生成两个部分。在试题生成时,首先从领域知识库中抓取领域知识,获取到其在领域知识库中的知识表示形式。其次,对获取的知识进行结构划分,匹配已定义好的题十句型模块,并根据不同的句型模块,选择不同的题干问句模板,最终形成题干库。在选项生成方面,改进了一种基于本体的概念相似度算法,并根据知识在本体知识库中所形成的概念“家族”树,论文采用基于概念相似度优先策略来生成试题的干扰项。最后,采用一种变异的标准遗传算法,选取存储于题库的试题,生成相应的试卷。经实验对比,这种策略具有知识共享性和可扩展性高、干扰项对正确选项干扰度较高等优点。此外,论文还对填空题以及简答题进行了自动出题,主要介绍了这两种类型试题的生成算法以及其答案的生成过程。(3)设计并实现一个基于本体的自动出题系统。论文利用J2EE中MVC (Model-View-Control)分层架构思想,设计并实现一个基于本体的自动出题系统。系统主要分为三个层次:表示层、业务逻辑层及数据层。其中,表示层,论文利用JSP体现服务器端与客户端之间数据的变化。业务逻辑层,论文利用HP Labs所提供的Jena来检索本体领域知识库的领域知识,并根据每一领域知识的不同描述匹配不同的题干模板,最终生成不同的试题,形成试题库。数据层,主要包括领域知识库本体和试题库,为上层服务提供可用数据。利用J2EE这一分层思想,可极大的提高系统的可扩展性,且层次结构分明,方便系统后期的维护。本文所实现的自动出题系统,对领域概念层次、概念关系、概念定义与概念特征进行了形式化描述,从而具备了丰富的领域知识、极强的推理能力以及知识的可扩展性。系统实现了全智能化的自动组卷,且能按照需求对知识的侧重点、描述等有更好的考察。从而,有效的解决了人工出题所存在的费时费力、更新速度慢、效率低下等问题,极大地提高了试卷生成的效率。